Новая программа определит пол и возраст twitter-блогера
Голландские программисты из Университета города Твенте разработали онлайн-программу, способную довольно точно определять пол и возраст пользователя соцсети Twitter, анализируя его сообщения в сети микроблоггинга. Разработчики говорят, что недавно завершили тестирование программы на базе из 3000 twitter-пользователей, которые регулярно отправляли в соцсеть короткие сообщения на разные темы. В программе была создана база знаний, которая при помощи синтаксического, семантического, словарного и иных типов анализа выявляла половую и возрастную принадлежность отправителя сообщений.
Разработчики молвят, что программке для достаточно точного определения нужно проанализировать около 200 твитов юзера и после чего оператор программки может просто ввести ник юзера, а программка выдаст информацию о том, что может прятаться за этим псевдонимом.
“Наш анализ показал, что разница меж блогерами мужиками и дамами достаточно стереотипна. Проще говоря, мужчины почаще молвят о футболе и политике, дамы – о ногтях”, – гласит Донг Нгуен, один из разработчиков программки. “С позиции возраста, юные юзеры почаще молвят о для себя самих и употребляют много смайликов, тогда как возрастные юзеры используют более сложные словарные обороты и почаще молвят на нетипичные темы”.
Не считая того, Нгуен гласит, что по собственной природе твиты юных юзеров более чувственны, нередко имеют очень позитивную либо очень нехорошую расцветку, что изредка встречается у юзеров старше 30 лет.
Пока программка анализирует твиты лишь на голландском и имеет относительную погрешность в 4 года при выявлении возраста.