Twitter по-русски: Твиттер блог русских твиттерян, новости twitter.com, тренды и главные темы русского твиттера

Твиттер научился распознавать слухиГруппа специалистов в сфере информационных технологий из университета Мичигана представила на интернациональной конференции WWW2015, прошедшей в итальянской Флоренции, созданное ими программное обеспечение. Оно поможет обнаруживать слухи в Twitter на ранней стадии.

Суть изобретения

Над разработкой подобного программного продукта группа программистов трудилась на протяжении последних 5 месяцев. Ещё 2 месяца ушло на отладку приложения и совершенствование используемого алгоритма. Метод работы инновационной программы основывается на фиксировании начальной волны скептической реакции со стороны пользователей на противоречивые информационные сообщения. Учёные считают, что разработанный ими софт способен помочь в пресечении распространения неправдивых слухов до того момента, пока они успеют нанести сколько-нибудь значительный ущерб.

Кстати, отметим, что на конференциями исследователями была продемонстрирована экспериментальная проверка их программы на нескольких обширных базах твиттер-сообщений, где она показала очень неплохие результаты. Ознакомиться же с новинкой можно на официальном интернет-сайте университета.

Правда или ложь?

Новая программа определит слухи на начальном этапе, что позволит не допустить их распространения

Как отслеживают слухи сейчас?

На данный момент распространение потенциальных слухов в сервисе микроблогов Twitter отслеживается двумя методами: наблюдениями за развитием свежих трендов и использованием некоторых хештегов как сигналов.

Это интересно: Каждая ныне использующаяся методика способна распознать слух лишь на завершающей стадии, после того как он достиг пика и набрал силу. Минус этого в том, что к тому моменту слух уже с большой долей вероятности мог вызвать потенциально опасные реакции общественности.

Но мичиганские учёные предложили кардинально другой способ. Он основывается на алгоритме из пяти последовательных шагов. Учитывается первичная скептическая реакция пользователей Твиттера на вызывающую сомнения или шокирующую информацию, которая распространяется «топикстартерами» слухов. Для удобства исследования ими было предложено рабочее определение слуха как определённого противоречивого и спорного утверждения, которое требует фактической проверки.

Larry Bird

Последствия слухов и фейковых новостей могут быть непредсказуемыми

Алгоритм работы программы

Как же работает новый программный продукт? Давайте разбираться!

  1. На начальном этапе программа обнаруживает все так называемые «сигнальные твиты». Так называются сообщения, в которых выражается сомнения или скепсис, задаются вопросы для определения правдивости информации. К примеру, «Это подтверждённые сведения?»; «Правда ли это?», «На самом деле?»; «Я сомневаюсь»; «Думаю, это ложь» и другие подобные высказывания.
  2. Затем выполняется кластеризация этих «сигнальных твитов» соответственно их содержанию (или содержанию твитов, для которых они ставали ответом или комментарием). Другими словами, выражения сомнения в сообщениях всегда связываются с информацией, по отношению к которой они возникли.
  3. На третьем этапе происходит вычленение ядерного содержания всех твитов в каждом кластере под видом одного понятного утверждения. Им и является потенциально распространяемая посредством слухов информация. К примеру, «На атомной электростанции в Корее случилась авария».
  4. На четвёртом этапе отсеиваются все нерелевантные твиты (которые могут, в свою очередь, формировать отдельные кластеры), а также выделяются основные кластеры-кандидаты, предположительно репрезентирующие конкретный слух.
  5. Ну а на заключительном этапе, с помощью нескольких статистических процедур, производится анализ, сравнение и ранжирование полученных на четвёртом шагу кластеров-кандидатов. После этого окончательно выделяется единственный кластер (или несколько), содержащий вирусно распространяемые через слухи спорные утверждения.

Оценка эффективности

Это интересно: Исследователи уверяют, что их программа обнаруживает любой потенциально вирусный слух на 3 часа 40 минут раньше, нежели при использовании трендов, и на 2 часа 50 минут раньше, чем при анализе хештегов.

Взрывы на Бостонском марафоне

Серия взрывов на Бостонском марафоне, 15.04.2013

Более того, традиционные подходы имеют точность порядка 10%, тогда как экспериментальная проверка нового программного продукта для обнаружения слухов на ранней стадии дала куда более впечатляющие результаты. Например, при анализе массива твитов (более 30 миллионов) за апрель 2013-го года, когда случились взрывы на Бостонском марафоне, разработанная учёными программа смогла успешно выявить 110 слухов, а точность превысила 50%.

Результат работы программы по определению слухов

Слухи, которые были выявлены по базе твитов, появившихся после серии взрывов на Бостонском марафоне

На выбранном же случайным образом массиве из 1,2 миллиардов сообщений (за ноябрь 2013-го), когда не произошло никаких значимых событий, слухи были обнаружены с точностью почти в 34%.

Результат работы программы по определению слухов

Слухи, которые были выявлены по базе сообщений за ноябрь 2013 года, когда никаких значимых событий не произошло

Зачем это нужно

Повышенный интерес к анализу распространения слухов через социальные сети возник после публикации фейкового твита со взломанного аккаунта новостного агентства «Associated Press», имевший место в 2013-ом году. Тогда хакеры разместили на нём запись «Срочно: 2 взрыва в Белом доме, Обама серьёзно ранен». Взлом аккаунта одного из наиболее авторитетных мировых информагентств (только в Твиттере у него 3 миллиона подписчиков) не мог пройти бесследно.

Фейковый твит о терактах в Белом доме

Фейковый твит о взрывах в Белом доме вызвал панику в обществе и падение финансовых индексов США на $140 млрд.

Это интересно: Всего лишь одна фейковая новость мгновенно обрушила финансовые индексы США на 140 пунктов, или почти на 1% (если конвертировать в валюту – это 130 миллиардов долларов). Не помогли ни оперативные опровержения от самого агентства, ни заявления официальной пресс-службы президента.

Реакция Твиттера на слухи о взрывах в Белом доме

Сеть распространения слухов о ранениях Барака Обама до их опровержения. Красные ноды — слухи, жёлтые — опровержения, синие — сомнения и вопросы

Кратковременная всеобщая паника в Соединённых Штатах и растерянность множества официальных лиц тогда стали ярким показателем степени доверия пользователей к публикуемым в Твиттере новостям, тем самым признав влияние глобального сервиса микроблогов на информационное пространство. Если бы этот слух тогда был вовремя распознан и классифицирован – как минимум общественной паники и падения финансового индекса страны можно было бы избежать. А лица, заранее знавшие о публикации фейковой новости, не смогли бы использовать это «временное помутнение» в собственных интересах.