در بخش نخست میزگرد تخصصی اداره کل پژوهشهای ایرنا در خصوص «نقش مراکز دادهکاوی در پیشبینی انتخابات ریاست جمهوری»، درباره اینکه اصولا میتوان فضای مجازی را آینه جامعه واقعی دانست یا نه و همچنین ظرفیت دادهکاوی در پیشبینی انتخابات، بحث شد.
مهمانهای برنامه که از دو شرکت اصلی دادهکاوی کشور دعوت شده بودند، درباره فعالیتهای باتها در مجازی و همچنین مهمترین چالشهای دادهکاوی در ایران و بحث ضریب پراکندگی اینترنت به عنوان یکی از مشکلات کشور در حوزه دادهکاوی اظهار نظر کردند.
در ادامه، سخنان «حمیدرضا کشاورز» مدیرعامل شرکت لایف وب و «امیرحسین عسگری» مدیرعامل شرکت دیتاک درباره ارتباط مقابل دادهکاوی و نظرسنجی و همچنین نقش این دو ابزار در تعیین و رصد افکارعمومی بحث و تحلیل شده است.
لایف وب با بررسی محتوای گروههای تلگرامی میزان آرای پزشکیان در دور دوم را با اختلاف ناچیزی ۵۴ درصد برآورد کرد این در حالی است که شرکت دیتاک به برآورد کلی مشارکت پرداخت و آن را در دور اول با اختلاف ۵ درصد و در دور دوم با اختلاف ۱.۵ درصد تخمین زد
شرکت لایف وب با بررسی محتوای گروههای تلگرامی میزان آرای مسعود پزشکیان در دور دوم را با اختلاف ناچیزی ۵۴ درصد برآورد کرد این در حالی است که شرکت دیتاک به برآورد کلی مشارکت پرداخت و آن را در دور اول با اختلاف ۵ درصد و در دور دوم با اختلاف ۱.۵ درصد تخمین زد که اتفاقی مهم در تحلیل و پیشبینی انتخابات بر اساس دادهکاوی فضای مجازی محسوب میشود.
نظرسنجی یا دادهکاوی؛ کدامیک بهتر افکار عمومی را منعکس میکنند؟
ایرنا: ارتباط میان نظرسنجی و داهکاوی و نحوه تعامل آن با افکار عمومی، یکی از پرسشهای همیشگی در علوم اجتماعی است. از نظر شما جایگاه این دو در برداشت و رصد افکار عمومی چگونه است؟ چه مزیتهایی در دادهکاوی هست که نظرسنجی ندارد و بالعکس؟ و بالاخره اینکه برای انعکاس افکارعمومی باید از نظرسنجی استفاده کرد یا دادهکاوی؟
عسگری: بحث نظرسنجی برای مدیریت و حکمرانی جامعه، تاریخی طولانی دارد. اینکه کسی بخواهد یک جامعه را مدیریت کند، باید بداند که نظر آن جامعه چیست. هر چقدر به زمان گذشته میرویم، فنآوری کمتر میشود. بنابراین مساله و راه حلهای متناسب با اقتضائات آن فضا تغییر میکند.
آن چیزی که اکنون میتوان از آن به عنوان روش نظرسنجی سنتیتر یاد کرد، دو روش حضوری و تلفنی است. روش تلفنی به نسبت روش حضوری جدیدتر است و تقریبا عمرش ۷۰-۶۰ سال بعد از نظرسنجی حضوری است. تقریبا همان روندی که برای نظرسنجی تلفنی پیش آمد برای دادهکاوی هم در این سالها رخ داد ، اما اکنون مرحله گذار را پشت سر گذاشته است.
نسبت نظرسنجی تلفنی و نظرسنجی حضوری، همانند نسبت دادهکاوی و نظرسنجی تلفنی است
زمانی که نظرسنجی تلفنی در کنار نظرسنجی حضوری استفاده شد، بسیاری براین باور بودند که اصلا این روش علمی نیست، برخی مخالفان میگفتند به هیچ عنوان نمیتوان به این روش اعتماد کرد، زیرا متغیرها در این روش مورد توجه قرار نمیگیرد و فقط به یک شماره تلفن اکتفا میشود.
اما وقتی این روش مورد استفاده جدی قرار گرفت و آزمونش را پس داد، بسیاری که تاکید داشتند، این روش غیر علمی است، تغییر نظر داده و با تولید مقاله اعلام کردند که نظرسنجی تلفنی روش مفید و پاسخگوی نیازهای جامعه است.
همین روند برای دادهکاوی نیز رخ داده است. یعنی مفهوم سر جایش است اما شیوه یا نوع جمعآوری دادهها تغییر کرده است.
در مورد دادهکاوی به طور مثال ۱۰تا ۱۲ سال پیش، گروهی از مدیران و سیاستگذاران معتقد بودند که این روش پاسخگوی نیازها نیست. اما از انتخابات ۱۳۹۲ تاکنون در هر انتخابات تاکید داشتهایم که رصد افکار عمومی جامعه در فضای مجازی با روش دادهکاوی کاملا امکانپذیر است.
انتخابات، بهترین بزنگاه ورود دادهکاوی برای رصد افکار عمومی جامعه است
این سوال مطرح است که چرا در هر انتخابات، دادهکاوی مهم میشود؟ به دلیل ساختار سیاسی که داریم و توزیع قدرتی که در این ساختار وجود دارد، حرف مردم در انتخابات برای ما خیلی اهمیت پیدا میکند و باید با آن مواجه بشویم یعنی همه آنهایی که ذینفع هستند، میدانند که مردم حرف آخر و نظر اصلی را میزنند.
در بسیاری جاهای دیگر اینطور نیست، نظر مردم ممکن است حاشیهای باشد یا حتی اصلا توجهی هم به آن نشود، بنابراین اتفاقی برای آن ذینفع رقم نمیخورد.
نمیتوان دادهکاوی فضای مجازی داشت و زیست آنلاین آن را به رسمیت نشناخت
مدیرعامل دیتاک: نکته حایز اهمیت اینجا این است که اگر بخواهیم دادهکاوی بر اساس فضای مجازی انجام دهیم باید زیست آنلاین آن را به رسمیت بشناسیم
نکته حایز اهمیت این است که اگر بخواهیم دادهکاوی بر اساس فضای مجازی انجام دهیم باید زیست آنلاین، را هم به رسمیت بشناسیم.
بپذیریم که زیست دیگری آن طرف رقم میخورد که روی زیست این طرف اثر میگذارد. اگر این موضوع را به رسمیت نشناسیم همه چیز به ایراد میخورد. آنهایی که این بحث را مطرح میکنند اول باید به این موضوع جواب دهند که بالاخره فضای مجازی، آیا فضایی در حد یک زیست موازی آفلاین است که اثرش حتی در جاهایی از پارامترهای زیست آفلاین هم بیشتر است؟ بنابراین باید متغیرهای فضای آنلاین را مورد توجه قرار داد نه متغیرهای فضای آفلاین.
در فضای آنلاین، اگر بخواهیم ببینیم نظرات چیست، در نظرات به نردبان کاربری برمیخوریم. این موضوع به این معناست که همه که تولید محتوا و استوری را ندارند، برخی در قالب کامنت نظر میدهند.بررسی این موارد لایههای تکنیکال پیچیدهای دارد.
نظرسنجی و دادهکاوی مکملهم هستند نه جایگزین هم
اکنون آیا نظرسنجی و دادهکاوی جایگزین هم باید بشوند؟ خیر. مکمل هم هستند. اصلیترین نقطه ضعفی که در نظرسنجی وجود دارد این است که نظرات خیلی ساده، عیان، شفاف گفته نمیشود و در بسیاری موارد نمیتوانید نظر را بگیرید.
مدیرعامل دیتاک: اصلیترین چالشی که در دادهکاوی وجود دارد این است که که برخی موقعیتها دیتا وجود ندارد و جامعه در فضای آنلاین نظر نمیدهد
اصلیترین چالشی که در دادهکاوی وجود دارد این است که در برخی موقعیتها دیتا وجود ندارد و جامعه در فضای آنلاین نظر نمیدهد. البته اگر حجم دیتا در موضوعی بالا باشد، خیالمان راحت است و اگر روش تحقیق درست و کارشناس مسلط باشد، کار انجام میشود اما وقتی داده وجود ندارد، شما نمیتوانید با دادهکاوی به نتیجه برسید.
از محدودیت نمونه آماری در نظرسنجی تا جامعیت نمونه در داده کاوی
یک نکته دیگر در حوزه دادهکاوی این است که در نظرسنجیها نمیتوانیم متمرکز شویم و رزولوشن را بالا ببریم و ببینیم چه اتفاقی میافتد و براساس متغیرهای محدودی، نظرسنجی انجام میشود. اما در دادهکاوی آرشیو فعالیت کاربران وجود دار. به طور مثال اینکه کاربران در انتخابات ۱۴۰۰ چه رفتاری داشتهاند یا در مورد موضوعات چه نظری دادهاند، پاسخ این موارد را میتوان از طریق دادهکاوی به دست آود تا بر جزئیات تسلط داشته باشیم.
ایرنا: شما کاربرها را طیفبندی میکنید؟
عسگری: میتوان کاربران را طیفبندی کرد؛ به طور مثال واکنشهای آنها در موضوعات مختلف و شبکه پیرامونی موضوع، در دادهکاوی قابلیت رصد دارد. در واقع در روش دادهکاوی فضای مجازی به طور مستمر امکان رسیدن به جزئیات وجود دارد و بهتر میتوان فهمید چه اتفاقی در حال وقوع است. مانند نقشههای قدیمی و نقشههای جدید؛ در نمونههای جدید امکان رسیدن به جزئیات جدید حتی پلاک خانه نیز وجود دارد.
ایرنا: ارجحیت دادهکاوی به نظرسنجی چیست؟
کشاورز: این موضوع را با پاسخ به این سوال یادآور میشوم که چرا از گذشته در علوم انسانی و علوم اجتماعی سراغ نمونهگیری میرفتند؟ زیرا امکان دسترسی به همه یا بخش بزرگی از جامعه خیلی آسان و سریع وجود نداشته و بنابراین در سنجشها از روش نمونهگیری استفاده شده است.
اما اکنون نکته مهم این است که در عصر کلان دادهها، امکان بزرگی برای علوم اجتماعی، روانشناسی، علوم سیاسی و بهطور کلی علوم انسانی فراهم شده که آن هم دسترسی فراگیر، سریع، آسانتر و ارزان به نظرات مردم و رویکردهایشان در حوزههای مختلف است.
این موضوع درواقع انقلابی را درعلوم انسانی در ۸ سال اخیر به وجود آورده و ظرفیتی را در اختیار ما قرار داده است که ذیل حوزه مطالعاتی و پژوهشی «علوم اجتماعی محاسباتی یا رایانشی» دیده می شود. اینکه اکنون، صحبتهایی درباره مرگ نظریهها مطرح میشود که مربوط به بهره گیری از الگوریتمها است به همین حوزه روش شناسی و معرفت شناسی مربوط میشود.
در نتایج نظرسنجی که ایسپا در ۶ تیرماه منتشر کرد تعداد نمونههایش را ۳۵۸۹ اعلام کرد این تعداد نمونه افرادی بودند که از جامعه آماری ایسپا با آنها مصاحبه و پرسشی صورت گرفته است. ما در انتخابات در توئیتر ۱۳ میلیون محتوا از ۲۴۰ هزار کاربر بررسی کردیم. ۳ هزار نفر آنجا در مقابل ۲۴۰ هزار کاربر منحصر به فرد.
ایرنا: درباره انتخابات؟ و چه بازه زمانی؟
بله. از روز ۲۰ خرداد که درواقع اعلام نتایج نهایی احراز صلاحیتها بود تا ۱۶ تیرماه یعنی فردای روز انتخابات. ببینید سه هزار نفر، دویست و چهل هزار نفر توی توئیتر، توی گروههای تلگرامی، از کانالهای تلگرامی صحبت نمیکنم چون آنجا با رسانه مواجه هستیم و آنجا با بررسی بازدیدها میشود تحلیلهایی داشته باشیم. من صحبت از کنشگری کاربرها در گروههای تلگرامی میکنم، آنجا ما دیگر با فرد مواجهیم. ۱۴ ملیون محتوا از ۷۴۰ هزار کاربر. ۷۴۰ هزار کاربر، ۳ هزار تا فردی که ایسپا با آنها مصاحبه کردند.
ما دادههای ۷۴۰ هزار نفر را به طور منحصر به فرد بررسی کردیم. نکتهای که وجود دارد این است که چه زمانی چنین فرصت و چنین امکانی در گذشتهها وجود داشته است که ما رجوع کنیم به نظرات این حجم از کاربرها؟ خود ما در گذشته به بسترهای مختلف و مولفههای مختلف در آن بسترها استناد میکردیم، مثلا شما فرض کنید درجه محبوبیتهای لایک در اینستاگرام یک وزنی دارد در توئیتر یک وزنی دارد و در بسترهای دیگر یک وزن دیگری دارد. ۳۰ الی ۴۰ مولفه را ترکیب میکردیم و برآوردش را ارائه میدادیم.
شبکههای اجتماعی دیگر خیلی اجتماعی نیستند
در دور اول انتخابات به این نتیجه رسیدیم که اگر میخواستیم به طور مجزا بسترها را بررسی کنیم، گروههای تلگرامی خیلی به واقعیت نزدیکتر بود. یک عقبه نظری هم داشت، در همین ماههای اخیر هفتهنامه اکونومیست یک یادداشتی منتشر کرد با این محور که مثل اینکه شبکههای اجتماعی دیگر خیلی اجتماعی نیستند و به این اشاره میکرد که یک بخش زیادی از کاربرها فعالیتشان منتقل شده است به گروهها در پلتفرمهای مختلف و موضوعی که تاکید میکرد این بود که شبکههای اجتماعی خیلی فضایشان دستکاری میشود و تحت تاثیر رفتارهای افراطی دیگران قرار میگیرد.
مدیرعامل لایف وب: براساس پژوهشهای ما، بررسی محتوای گروههای تلگرامی نزدیکترین تخمین را به نتیجه واقعی داشته چنانکه درصد آرای آقای پزشکیان را در دور دوم با اختلاف بسیار کم ۵۴ درصد برآورد کردیم
من همچنان نظر آقای عسگری را تایید میکنم که برای ما تشخیص رفتار رباتیک، شبه رباتیک و جریان سازمانیافته میسر است و چیز عجیب و غریبی برای ما نیست و در بررسیهایمان تحتتاثیر آن قرار نمیگیریم. اگر بخواهم از نظر مصداقی بگویم اینکه محتوای منفی پیرامون آقای پزشکیان و محتوای مثبت درباره آقای جلیلی به شکل شبه رباتیک نشر و بازنشر میشد. اتفاقا در دور دوم ما همان ۵۴ درصد آقای پزشکیان را با استفاده از داده گروهها با درصد دقیق پیشبینی کردیم.
ایرنا: بحث مرجعیت مجازی مساله مهم دیگری است که بارها در مقالات و پژوهشها بدان اشاره شده است. از نظر شما، مرجعیت مجازی را چطور میتوان پیدا کرد؟
مدیرعامل لایف وب: سال ۹۹، کمپینی راه افتاد تحت عنوان «اعدام نکنید» که به عنوان بزرگترین راهپیمایی مجازی ایرانیان مطرح شد که سخنگوی وقت قوهقضائیه اعلام کردند که رباتیک است اما اصلا رباتیک نبود
کشاورز: سال ۱۳۹۹، کمپین مجازی راه افتاد که به عنوان بزرگترین راهپیمایی مجازی مطرح شد اما بعد آن را اقدامی رباتیک توصیف کردند در حالی که حدود ۷۰ درصدش فعالیت رباتیک و شبه رباتیک نبود.
در ماجرای مهسا امینی نیز یک سوال اساسی مطرح بود که آیا آنچه که بعد از این ماجرا اتفاق افتاد رباتیک بود یا خیر؟ پاسخ به این سوال میتوانست در بسیاری از تصمیمگیریهای کلان حاکمیتی اثرگذار باشد. ببینید آنچه که در روزهای اول اتفاق افتاد ، ما شاهد این بودیم که حول و حوش ۷۲ درصد از کاربرهای توئیتر، حداقل یک عدد محتوا درباره مهسا امینی داشتند. این نشان میداد که این موضوع به شکل وسیعی جامعه را درگیر کرده است. اما از روزهای اول که عبور کردیم ، آن موج احساسی و هیجانی فروکش کرد.
این مربوط به تجمیع دادههای سهماه بعد از ماجرای مهسا امینی است عدد خیلی قابل توجهی است: تا قبل از اتفاقات این ماجرا ، روزانه بین ۴۰۰ تا ۶۰۰ کاربر در توئیتر عضو میشد، در هفته بعد از این رخداد، رقم به حدود ۱۰ هزار کاربر رسید. روزی ۴۰۰ تا ۶۰۰ و حتی ۱۰ هزارتا. این به چه معنی است؟ این که یک بخش قابل توجهی از مردم توئیتر را میدانی دیدند برای کنشگری و ظهور و بروز.
هرچه فضای آفلاین کف خیابان رادیکالتر میشد، کاربران نیز بیشتر در فضای مجازی تمایل داشتند نظر و اعتراضشان را ابراز کنند، در شبکههای اجتماعی و آنجا شاهد بودیم که خیلیها عضو توئیتر شدند تا بتوانند نظرات و حرفهایشان را مطرح کنند اما خیلی جالب است که نزدیک به ۸۰ درصد از آن محتواها که گفته میشد که رسید به ۴۰۰ تا ۶۰۰ میلیون محتوا، ۸۰ درصد از آن محتواها کار ۵ درصد از کاربرها بود. ۵ درصد از کاربران نزدیک ۸۰ درصد از محتوا را منتشر میکردند.
فضاسازی مجازی با عقیدهکاوی کاربران واقعی متفاوت است
در واقع، فضایی برای مردم تصویر میشود چه در انتخابات، چه در بزنگاههای مختلف اجتماعی سیاسی، اندازهگیری و بررسی و تحلیل آن فضا با عقیدهکاوی مردم متفاوت است.
در انتخابات ۱۴۰۰، هنوز نتایج احراز صلاحیتها نیامده بود و مشخص نشده بود و فردی ثبتنام کرده بود که بعدا رد صلاحیت شد، آن موقع اگر تنها میزان و کیفیت محتواها را میدیدید، وی باید با یک اختلاف آرای زیاد پیروز انتخابات معرفی میشد اما برای ما روشن بود چه بخشی از این سبد رفتار شبه رباتیک، سازمانیافته و جریانی است.
در شبکههای اجتماعی شاهد رواج نسبیگرایی هستیم
در انتخابات ۲۰۲۲ فرانسه، انتخابات ۲۰۲۳ ترکیه و در انتخابات ۱۳۹۶، ۱۴۰۰و ۱۴۰۳ ایران به دلایل مختلفی که یک بخشی از آن تحتتاثیر ظهور و بروز شبکههای اجتماعی است، میشود گفت تا حدود زیادی دوره پیروزیهای قاطع و با اختلاف زیاد گذشته است. حتی همان انقلاب مصر که به عنوان انقلاب فیسبوکی از آن یاد میشود، حسنی مبارک با احمد شفیق رقابت کرد با یک اختلاف خیلی ناچیز کمتر از ۲ درصد پیروز شد.
در عصر شبکههای اجتماعی نکته قابل تمایز، این است که نسبیت و نسبیگرایی خیلی رواج پیدا کرده است و دیگر به این شکل نیست که خرده روایتها به سادگی تجمیع شده و تبدیل به یک روایت واحد و فراگیر شود و این عصری است که ما به شدت با عدم قطعیتها مواجه هستیم.
در مجموع با توجه به ا ینکه در ایران بهخاطر آن زمینههای سیاسی- فرهنگی که وجود دارد و فضا اساسا برای مردم مبهم است، چه در شرکتشان در انتخابات، چه در موضعگیریهایشان، چه در واقع کدام سمت حرکت کنند فضا اساسا مبهم است، چه برسد به این که ما بخواهیم ردپای دیجیتال مردم را بررسی کنیم.
ادامه دارد...
نظر شما