تقریباً هر کلیک آنلاین، هربار کشیدن انگشت روی تبلت و هر ضربه روی تلفن هوشمند، یک نقطه داده در یک مخزن مجازی ایجاد میکند. فیسبوک دادههای زندگی بیش از دو میلیارد نفر را تولید و ذخیره میکند. توییتر فعالیت ماهانه بیش از ۳۳۰ میلیون کاربر را ثبت میکند. یک مطالعه MIT نشان داد که یک کارمند در آمریکا بطور متوسط روزانه ۵ گیگابایت داده تولید میکند. هرچه بیشتر مردم زندگی خود را بصورت آنلاین پیش میبرند و تلفنهای همراه هوشمند گسترش پیدا میکنند، این مجموعه دادهها بزرگ و بزرگتر میشوند.
گزارشهای زیادی وجود دارد که با استفاده از این حجم عظیم دادههای تولید شده توسط کاربران و پلتفرمهای اجتماعی تولید شدهاند. محققان همچنان درحالی دستیابی به تخصص بیشتر و در مقیاسی گستردهتر برای بهرهبرداری و تحلیل دادهها هستند.
آمار یاد شده در ابتدای متن برای سال ۲۰۱۳ بود! هرچه بیشتر مردم زندگی خود را به صورت آنلاین پیش میبرند این مجموعه دادهها افزایش پیدا میکند. گزارشهای زیادی وجود دارد که میتوان از طریق دادههای شبکههای مجازی نوشت. دخالت روسیه در انتخابات ریاست جمهوری ۲۰۱۶ و حتی ۲۰۲۰ آمریکا و برگزیت، گسترش خطرناک سخنان ضد مسلمانان در فیسبوک، توییتر و ... نشان میدهد که نیاز روز افزونی به بالابردن سطح سوادمان در رابطه با دادهها در شبکههای اجتماعی داریم.
روزنامهنگاران چگونه میتوانند از دادههای رسانههای اجتماعی استفاده کنند؟
درحالی که راههای مختلفی وجود دارد که رسانههای اجتماعی میتوانند برای نوشتن گزارش مفید باشند، ممکن است بررسی دادههایی که میتوانیم از رسانههای جمعی به دو طریق زیر به دست آوریم مفیدتر باشد.
اول؛ رسانههای اجتماعی میتوانند برای درک بهتر افراد و اقدامات آنها استفاده شوند؛ از اطلاعات عمومی گرفته تا مبادلات خصوصی بین افراد. بسیاری از اقدامات مردم ردپایی را بصورت آنلاین برجا میگذارد که میتواند برای تحلیل استخراج شود. اینکار بویژه زمان بررسی عملکرد سیاستمداران و دیگر شخصیتها بسیار مفید است. این مسئله میتواند نشاندهنده تأثیر سیاست افراد در افکار عمومی باشد و پیامد تصمیمات مختلف را به مردم نشان دهد؛ مثلاً سقوط شدید قیمت سهام و اخراج افراد مهم.
دوم؛ وب میتواند به تنهایی به عنوان یک اکوسیستم درنظر گرفته شود که در آن اتفاقات مختلف روی پلتفرمهای اجتماعی رخ میدهند. البته هنوز هم این شبکهها توسط اقدامات انسانی هدایت میشوند. کمپینهایی با اطلاعات نادرست، جهانهای اطلاعاتی منحرف شده توسط الگوریتمها و حملات ترولها، تمام اینها پدیدههایی مختص شبکههای اجتماعی و وب هستند.
مطالعات موردی
به جای بحث انتزاعی راجع به این نوع گزارشها، درک دادههای رسانههای اجتماعی و نحوهی استفاده از آنها برای بیان یک داستان خاص میتواند بسیار مفیدتر باشد. در بخشهای بعدی تعدادی از پروژههای روزنامهنگاری را که از دادههای شبکههای اجتماعی استفاده کردهاند مورد بررسی قرار میدهیم.
درک مردم از شخصیتها؛ دادههای رسانههای اجتماعی، مسئولیتپذیری را نشان میدهند
برای سلبریتیها یا افراد مهم، رسانههای اجتماعی راهی برای مخاطب قرار دادن مردم به شیوهی مستقیم است. بهروزرسانی استوریها، پستها و توییتها میتوانند به عنوان راههای دور زدن فرمهای قدیمیتر مثل مصاحبه، بیانیه مطبوعاتی یا کنفرانسهای مختلف عمل کنند. البته برای سیاستمداران بیانیههای عمومی یک سیاست است که در هر صورت اجرا میشود اما از آنجایی که وظیفه سیاستمدار تا حدی قرار گرفتن در معرض دید عموم مردم است، تحقیق درمورد حسابهای این افراد در رسانههای اجتماعی میتواند درک بهتری از ذهنیت ایدئولوژیک این افراد به مخاطب ارائه دهد.
Charlie Warzel بیش از ۲۰۰۰۰ توییت از دونالد ترامپ جمعآوری و تجزیه تحلیل کرد تا به سوال زیر پاسخ بدهد:
ترامپ چه نوع اطلاعاتی را منتشر میکند و چگونه این اطلاعات میتوانند نمایندهی نوع اطلاعاتی که ترامپ به دست میآورد باشند؟
دادهها نشان میدادند که اطلاعاتی که ترامپ دریافت میکند بیشتر از کجاست. ترامپ به breibart News توجه زیادی داشت که به علت رابطه قوی او با Steve Bannon در زندگی واقعی بود. توییتهای دیگر او هم از وبلاگهای خبری کوچکتری مانند The Conservative Tree House و News Ninja بود که نشان دهندهی شخصیت ترامپ است. او به «رسانههای اصلی» بیاعتماد است!
ردیابی عملکرد انسانها
درحالی که ارتباطات عمومی مانند توییتها و پستها میتوانند بینشی درباره اینکه مردم چطور فکر میکنند ارائه کنند، دادههایی هم وجود دارند که پشت دیوارهای بسته زندگی میکنند. مانند پیامهای خصوصی، جستجوی گوگل یا دادههای موقعیت جغرافیایی.
Christian Rudder یکی از بنیانگذاران OKCupid و نویسنده کتاب Dataclysm توصیف خوبی از این دادهها دارد: «اینها آماری هستند که از رفتار ما ثبت میشوند، درست در زمانی که فکر میکنیم هیچکس ما را تماشا نمیکند!»
به واسطه استفاده از پلتفرمهای اجتماعی، فرد در نهایت دادههای مختلفی از کنشهای خود تولید میکند. زمانی که قرار است راجع به شخصی گزارش نوشته شود این دادهها بسیار بسیار قدرتمند و مفید هستند. به عنوان مثال داستان Jeffrey Ngo را درنظر بگیرید. هنگامی که در اوایل سپتامبر سال ۲۰۱۴ تظاهرات طرفداران دموکراسی در هنگکنگ، زادگاه Ngo، آغاز شد او دانشجوی دانشگاه نیویورک بود و احساس کرد باید کاری در این خصوص انجام دهد.
Ngo شروع به صحبت با سایر هنگکنگیهای مهاجر در نیویورک و واشنگتن کرد. او درنهایت توانست تظاهراتی را در ۸۶ شهر در سراسر جهان ترتیب دهد. در گزارشی که الجزیره میخواست راجع به Ngo کار کند، Ngo اجازه داد تا تاریخچه شخصی فیسبوک او استخراج شود- آرشیوی که هر کاربر میتواند از این پلتفرم دانلود کند.
دیتاژورنالیستها پیامهایی را که او با یکی از سازماندهندگان اصلی هنگکنگ رد و بدل کرده بود را جمع کردند و به ۱۰ اتاق گفتگوی متفاوت رسیدند. نمودار زیر نوسانات و جریان ارتباطات آنها را مستند میکند. در زمانهایی که رویدادی خشم عمومی را به همراه داشت، مانند پرتاب گاز اشکآور به سمت معترضین، فعالیتهای سیاسی در این اتاقها بیشتر میشد.
سپس یک اتاق گفتگوی دیگر پیدا کردند که در آن سازماندهندگان اصلی، فعالیتهای سیاسی را بسیار فراتر از رویدادهای خبری اولیه برنامهریزی میکردند. از آنجایی که بیشتر برنامهریزیها در داخل این اتاق گفتگو انجام میشد، آنها توانستند لحظهای را که Ngo با Angel Yau ملاقات کردهاست را پیدا کنند. خود Ngo نمیتوانست اولین ارتباطاتش با افراد را به خاطر بیاورد اما به لطف آرشیو فیسبوک دیتاژورنالیستها توانستنند اولین مکالمات Ngo و Yau را بدست آورند.
پدیدههای خاص سیستمهای آنلاین
بسیاری از تعاملات ما به صورت انحصاری به سیستم عاملهای آنلاین منتقل میشوند. درحالی که بیشتر رفتارهای اجتماعی ما هم بصورت آنلاین و هم بصورت آفلاین انجام میشود اما محیط آنلاین هنوز خاص است چراکه محیط آنلاین ابزارهای قدرتمند و جدیدی به ما میدهد.
در محیط اجتماعی همیشه افراد قلدر وجود داشتهاند. اما اکنون قلدرها توسط هزاران قلدر دیگر حمایت میشوند و میشود در یک چشم به هم زدن با آنها تماس گرفت. ماهیت ترولینگ (trolling) همین است. در متنهای قبلی به صورت مفصل راجع به ترولها صحبت کردهایم. این افراد در شبکههای اجتماعی نفرتپراکنی میکنند و حرفهای نامربوط میزنند تا ذهنها را منحرف کنند یا فرد مقابل را آزار دهند.
به ترولها غذا ندهید/ ردپای ترولها در شبکههای مجازی
برای مثال Doris Truong، سردبیر واشنگتن پست، به ناگاه خود را وسط یک جنجال سیاسی آنلاین پیدا کرد. در طول چندروز، ترولها (و کسانی که از او حمایت میکردند) او را در ۲۴۷۳۱ توییت به او اشاره (منشن - Mention) کردند. این حملات در فضای مجازی را میتوان به مدت طولانی نادیده گرفت، قبل از اینکه تلفات عاطفی ایجاد کند!
ترولینگ به مشکلی تبدیل شدهاست که میتواند هرکسی را درگیر کند. چه فرد معروف و مشهوری باشد و چه نباشد. از شوخی درباره HIV تا مسخره کردن یک کیک فروش و...
جنگهای اطلاعاتی
ظهور و استفاده دائم از شبکههای اجتماعی پدیدهی جدیدی را در زندگی ما ایجاد کردهاست: همهگیری!
اشتراک گذاریهای اجتماعی این امکان را فراهم کردهاند که هرنوع محتوایی نه فقط توسط صدنفر، بلکه توسط میلیونها نفر دیده شود بدون اینکه درباره آن تبلیغ شده باشد.
البته این مسئله یک معنای دیگر هم دارد و آن این است که بسیاری از مردم راههایی برای پیدا کردن فالوئرهای جعلی یا خریداری شده یا حسابهای نیمهخودکار پیدا کردهاند. رباتها همیشه بد نیستند اما همانطور که Ben Nimmo، یکی از اعضای شورای آتلانتیک پس از سالها تحقیق درباره ارتش رباتها گفت: «رباتها این پتانسیل را دارند که بصورت جدی یک موضوع را تحریف کنند! آنها همچنین میتوانند یک گروه شش نفری را شبیه به یک گروه ۴۶۰۰۰ نفری کنند.» خود پلتفرمهای اجتماعی وظیفه دارند رباتهای مشکلساز را شناسایی کنند اما در این میان روزنامهنگاران هم مسئولیت مهمی دارند و باید با حضور فعال خود، قدرت رباتها را تشخیص دهند و از قدرت یافتن بیشتر آنها جلوگیری کنند.
در تصویر بالا توییتهای یک انسان با توییتهای یک ربات مقایسه شدهاست.
BuzzFeed News دادههای توییتر یکی از ویراستاران خود به نام Tom Namako و دادههای حسابهای ربات مانند را باهم مقایسه کرد تا تفاوتهای رفتاری و شخصیتی رباتها و انسانها را برجسته کند. نمودار دوم نشان میدهد که ۲۹۵۵ توییت سردبیر BuzzFeed به صورت مساوی بین چندماه تقسیم شده است. تعداد توییتهای او روزانه به سختی به ۷۰ توییت میرسید و تازه همین سطح از فعالیت هم توسط تیم تحقیقات قانونی مشکوک بنظر میرسید. نمودار اول هم ۲۹۵۵ توییت یک ربات را نشان میدهد و این درحالی است که یک ربات فقط ۵۸۰ توییت در یک روز ایجاد کرده بود و ناگهان متوقف شده بود!
فعالیت یک حساب کاربری نشانه خوبی برای تشخیص ربات بودن یا نبودن آن است.
نحوه جمعآوری دادههای اجتماعی
به صورت کلی سه روش مختلف برای جمعآوری دادههای شبکههای اجتماعی وجود دارد؛ API ها، بایگانیهای شخصی و تجزیه تحلیل.
نوع دادههایی که کانالهای رسمی مثل API ارائه میکنند بسیار محدود است. در فیسبوک محققها میتوانستند دادههایی را از صفحات دریافت کنند اما پس از اعمال محدودیت دسترسی به دادهها آنها فقط بخش کمی از دادهها را ارائه میدهند.
در توییتر این دسترسی اغلب به تعدادی از توییتها در جدول زمانی کاربر محدود شدهاست پس محدودیتهایی درمورد نوع دادههایی که میشود به آنها دسترسی داشت وجود دارد.
درک اینکه چه کسانی از رسانههای اجتماعی استفاده میکنند و چه کسانی استفاده نمیکنند بسیار مهم و ضروری است. یکی از بزرگترین مسائل مربوط به دادهها در شبکههای مجازی این است که ما نمیتوانیم تصور کنیم افرادی که در توییتر یا فیسبوک فعالیت دارند نمایندهای از جمعیت گستردهتر آفلاین هستند!
تعداد زیادی از مردم در شبکههای اجتماعی حساب کاربری دارند اما آنها به هیچ عنوان نماینده اکثریت نیستند و روزنامهنگار باید مراقب باشد نظرات بیان شده مربوط به عموم مردم باشد. چند مسئله را هم باید در نظر داشت:
- هر کاربر نمایندهی یک انسان واقعی نیست! حسابهای خودکار (رباتها) و حسابهای نیمهخودکار در شبکههای مجازی وجود دارند و برخی کاربران هم چندین حساب کاربری دارند.
- خود برتربینی افراد پر سروصدا. این موضوع را باید درنظر داشت که اغلب مردم سکوت کردن را انتخاب میکنند. صدای افراد متعادل بسیار کمتر شنیده میشود و افراد افراطی بیشترین سروصدا را در شبکههای اجتماعی دارند. این به معنای آن است که محتواهایی که در فیسبوک، توییتر یا سایر پلتفرمهای اجتماعی ما قرار میگیرند براساس لایک، ریتوییتها و نظرات کسانی است که آن صفحه پر سروصدا را دنبال کردهاند. افراد ساکت یا متعادل کمتر لایک میشوند و به همان نسبت کمتر دیده میشوند.
باید مراقب دادههایی که از شبکههای مجازی به دست میآوریم باشیم. از این دادهها میتوان گزارشهای خوبی استخراج کرد و یا میتوانند سرنخهای خوبی برای گزارشهای بعدی به ما بدهند. با این حال توجه به این نکته ضروری است که نباید نظرات در شبکههای مجازی را به نظرات اکثریت مردم تعمیم داد. شما تنها میتوانید این نظرات را به عنوان نظرات بخشی از مردم مورد بررسی قرار دهید و بخشی از حقیقت ماجرا را بدست آورید. زمانی که اوضاع آشفته میشود و سروصداها زیاد میشود شناخت رباتها برای روزنامهنگار ضروری است. باید بتوانید آنها را از حسابهای کاربری حقیقی تشخیص دهید.