Алгоритм, обученный на пользователях Твиттера, может предсказать, будут ли граждане голосовать за Дональда Трампа или Хиллари Клинтон. Возможно, более удивительный, инструмент также предсказывает, какие государства пойдут синие или красные (демократ или республиканец).Писание в Твиттере о словах «ложь», «либеральная», «незаконная» и «деньги», например, указывает на голосование за Трампа.
Используя «единственные» слова, «человечество», «права» и «y’all», с другой стороны, предсказывает голосование за Клинтона.«Это не самые распространенные термины, которые избиратели используют в Твиттере», сказал Ларри Бирнбаум, преподаватель информатики в Школе Маккормика Нортвестерна Разработки. «Они – большинство прогнозирующих условий».TweetCast использует алгоритм машинного обучения, чтобы исследовать слова, хэштеги, теговые имена пользователей и упомянул веб-сайты, чтобы раскрыть, какие условия являются самыми прогнозирующими из голосующего предпочтения.
Точность предсказания TweetCast предпочтения избирателя составляет 80 процентов.Команда Бирнбаума не разработала алгоритм, используемый в TweetCast, но исследователи первые, чтобы применить этот подход к определению политических предпочтений, анализируя твиты.
Бирнбаум и его студенты сначала начали версию TweetCast для президентских выборов 2012 года. Инструмент был включен в «Наши Выборы PBS MediaShift Idea Lab для Самого Инновационного Освещения Выборов».Алгоритм был обучен на пользователях Твиттера, которые публично объявили поддержку одного из этих двух кандидатов. Во время обучения алгоритм нашел образцы в деятельности тех пользователей и применил те образцы к пользователям через Твиттер.
Для этих президентских выборов Бирнбаум и аспирант Джейсон Кон расширили инструмент, чтобы предсказать государства, которые Трамп возьмет и государства, которые возьмет Клинтон.При помощи особенности геолокации Твиттера алгоритм беспорядочно пробовал приблизительно 80 000 пользователей Твиттера от каждого государства. На основе прогнозирующих слов тех пользователей TweetCast мог сделать предсказание, для которого государства будут, скорее всего, голосовать за консерваторов (Нью-Йорк, Калифорния и Иллинойс, например) или красный (Миссисипи, Арканзас и Техас).
TweetCast все еще экспериментален и столкнулся с некоторыми проблемами. Государства с меньшим количеством пользователей Твиттера, таких как Вайоминг и Монтана, более хитры, чтобы предсказать.
Бирнбаум также указывает, что пользователи Твиттера уклоняются молодой и либеральный. Его команда в настоящее время работает с экспертом по машинному обучению Дугласом Дауни, адъюнкт-профессором информатики в Маккормике, чтобы исследовать способы дать компенсацию за эти уклоны.Можно вообразить, как информация TweetCast может помочь кампаниям предназначаться для избирателей и использовать Твиттер, чтобы выдвинуть явку избирателей, но Бирнбаум сказал, что это также показывает, что много предпочтений могут быть подобраны из Твиттера.
«TweetCast – хороший пример того, что мы можем сказать о Вас с Твиттера», сказал Бирнбаум. «Мы можем определить много с языка, который Вы используете, включая которые рестораны Вам нравится, книги Вы прочитанный, спорт, которым Вы наслаждаетесь, новости, которые Вы потребляете – и за кого Вы будете голосовать».Любой может попробовать TweetCast, чтобы видеть, предсказывает ли он правильно, какого кандидата в президенты пользователь поддерживает: http://tweetcast2016.infolab.northwestern.edu/
