Вчені розробили детектор школярів в соцмережах

Група соціологів продемонструвала можливість автоматично розпізнавати стать, вік і ряд психологічних характеристик користувачів соціальної мережі Facebook на основі їх статусів. За словами вчених, це дозволяє формалізувати ряд спостережень і дає новий інструмент для проведення досліджень. Подробиці з посиланням на публікацію дослідників в журналі PLoS One опубліковано на офіційному сайт Університету Пенсільванії.

У ході своєї роботи співробітники університету Пенсільванії і Кембріджського університету у Великобританії вивчали лексику, використовувану в статусах Facebook. Під статусом розуміється короткий текст, що розміщується від свого імені в соцмережах. У тексті зазвичай вказують поточне заняття, настрій або іншу інформацію.

Соціологи зібрали дані про 136 тисячах користувачів (всі вони підписалися на участь в науковому дослідженні), які в цілому оновили свій рядок статусу більше 13 мільйонів разів. Щоб отримати коректну інформацію, вчені брали тільки тих, хто за час експерименту написав більше 1000 слів в рядоку статусу. У підсумку вибірка авторів дослідження включала 15,4 мільйона статусів з 309 мільйонами слів від 74941 людини.

Далі соціологи взяли заповнені тими ж людьми онлайн-опитування і спробували знайти кореляції народження тих чи інших слів у статусі з тими чи іншими характеристиками людини. Математичний аналіз матеріалу продемонстрував, що навіть поєднання символів, які були виділені в слова суто формально (як довільна комбінація між двома пробілами), дозволяють дізнатися, наприклад, стать користувача. Поєднання знака «менше» і цифри 3 дозволяє впевнено говорити про те, що рядок статусу оновлена ​​жінкою, а не чоловіком. У той же час лайка вказує на чоловічу стать власника акаунта.

Дослідники також запропонували добровольцям встановити онлайн-додаток My Personality з психологічними опитуваннями, заснованими на тесті NEO Personality Inventory Revised (NEO-PI-R). Цей тест видавав результати по п’яти різних шкалами: екстраверсія, зговірливість, свідомість, невротизм і відкритість; скорочена версія такого тесту вже використовувалася в іншій присвяченій Facebook роботі.

Аналіз матеріалу тестів показав, що екстраверти частіше використовують слова «вечірка» і «дівчата», в той час як інтроверти віддають перевагу комп’ютерам та інтернету, а також аніме – хоча коефіцієнт кореляції для аніме і інтроверсії виявився нижче, ніж для інтроверсії і смайла « ^ _ ^ ». Крім того, вчені побачили і характерні для певного віку вирази: наприклад, «домашнє завдання» і назви предметів видають школярів, а «дочка» або «чоловік» характерні для тих, кому більше тридцяти років.

Дослідники вважають, що їх робота дозволяє відокремити стереотипи про ту чи іншої категорії користувачів від її реальних характеристик. Вони вважають вдалим рішення не підраховувати частотність того чи іншого слова із закритого списку (скажімо, з числа «позитивних емоцій» або з безлічі «лайки»), а взяти слова і поєднання символів, спочатку присутні у вибірці. Ще одна перевага підходу – порівняльна швидкість оновлення даних.

Поява соціальних мереж з мільйонами активних користувачів вивело (як стверджується у введенні до статті американо-британської групи) соціологію на новий рівень. Якщо раніше опитування хоча б тисячі людей вимагав складної польової роботи, то онлайн-дослідження дозволяють оперативно збирати на порядки більші вибірки і аналізувати їх з використанням автоматичних методів. Таким чином вже вдалося відстежити реакцію суспільства на різні події, простежити за епідеміями грипу та знайти спосіб визначити характеристики користувача по «лайкам» (хоча і з великою похибкою).

Залишити коментар

Ваша електронна адреса не буде опублікована.Обов'язкові поля позначені *

*