در این پژوهش اطلاعات ۹۹۹ داوطلب که با به اشتراک گذاشتن سوابق پزشکی خود و پستهای خود در شبکههای اجتماعی موافقت کرده بودند و نزدیک به ۲۰ میلیون کلمه مورد تجزیه و تحلیل قرار گرفت و محققان الگوهای زبانی از جمله کلمات، عبارات، گروه کلمات مرتبط و ارتباط آماری آنها با ۲۱ دستهبندی استاندارد تشخیصهای پزشکی را مورد بررسی قرار دادند.
آنها در گام بعدی از سه الگو برای تجزیه و تحلیل شرایط جامعه آماری خود استفاده کردند؛ یکی از این الگوها زبان پست فیسبوکی را تحلیل میکرد، الگوی بعدی متغیرهایی چون سن و جنسیت را مورد بررسی قرار میداد و الگوی سوم این دو گروه از دادهها را با هم ترکیب میکرد.
یافتههای این مطالعه نشان داد که پستهای فیسبوکی به تنهایی ۲۱ بیماری را پیشبینی کرده و در پیشبینی ۱۰ بیماری دیگر در مقایسه با دادههای آماری موفقتر عمل میکنند.
با استفاده از این روش میتوان علاوه بر بیماریهای خاصی چون دیابت، اختلالات روانی چون اضطراب، افسردگی و روانپریشی (psychosis) را نیز در برخی بیماران پیشبینی کرد.
اندرو شوارتز استادیار علوم کامپیوتر و مولف ارشد این پژوهش میگوید: «پیشبینیهای مبتنی بر زبان ما به همان خوبی شاخصه توده بدنی فرد در تشخیص دیابت دقیق بود. اگر الگوهای زبانی را همارز ژنوم بگیریم خواهیم دید که بیماریهای مشابه الگوهای زبانی مشابهی دارند.»
«زبان دیجیتال ما آن ابعاد از زندگیمان را به تصویر میکشد که کاملاً با آنچه در دادههای سنتی پزشکی توصیف شدهاند، تفاوت دارد. با بررسی طیف وسیعی از اختلالات و بیماریها، تصویری از ارتباط میان این بیماریها به دست آمده که میتواند ساخت نرمافزارهای جدید مبتنی بر هوش مصنوعی را در حوزه پزشکی ممکن کند.»
دادههای فیسبوکی در جریان این پژوهش گاه به طور مستقیم و گاه غیرمستقیم بیماریها و اختلالات خاص را پیشبینی میکردند. به عنوان نمونه، اگرچه کلماتی چون «بطری» (bottle) و «نوشیدنی» (drink) به روشنی از اعتیاد به الکل در کاربر مورد نظر حکایت دارد، جالب است بدانید براساس یافتههای برآمده از این مطالعه، شانس ابتلای کاربرانی که اغلب از کلمات و عباراتی چون دعا کردن در پستهای خود استفاده میکنند به دیابت، ۱۵ برابر بیشتر از سایرین است!
جزئیات این مطالعه در مجله PLOS ONE منتشر شده است.