Рассказываем, что увидели ученые, построив «социальную сеть русского компромата» на 11 тысяч человек. Спойлер: Путин официально самый токсичный! Но ведь если ваши связи помогают вам прятать деньги и возводить на них дворцы, то «токсичность» можно и потерпеть? Ради комнаты для грязи — годятся любые связи. Подробности — в нашей статье
Иллюстратор: Юлия Бобкова
Исследование под названием «Социальная сеть русского компромата» вышло минувшей осенью на ArXiv.org (там обычно публикуют свои статьи математики, физики и специалисты в компьютерных науках). Автор исследования — профессор компьютерных наук Саффолкского университет в Массачуссетсе Дмитрий Зиновьев. Он построил социальную сеть (граф) на основе совместных упоминаний известных политиков и общественных деятелей в архиве компромата «RuCompromat».
Построив граф, ученый с коллегами исследовали его методами сетевого анализа. Центральным персонажем соцсети русского компромата оказался Владимир Путин — вне зависимости от метрики центральности. А еще в графе хорошо выделились сообщества «силовиков».
Теперь подробнее.
Ресурс RuCompromat называет себя «Энциклопедией библиотеки компромата». Фактически это агрегатор статей из СМИ, которые действительно чаще всего содержат компрометирующую информацию о ком-либо. Таким образом, RuCompromat — это база негативных публикаций в СМИ о политиках, бизнесменах и других известных россиянах.
Плюс RuCompromat — большой охват и наличие разметки. По времени коллекция охватывает период с 1991 по 2020 год. Для текстов с 2013 по 2020 размечены персоны, к которым относится компромат, а также организации и топонимы.
Например, в базе размещена статья от 4 января 2021 под заголовком «Сечин зажал чиновникам колбаски» от издания The Bell. Статья рассказывает о том, что чиновники в этом году не получили от главы «Роснефти» традиционный подарок в виде корзины с колбасой (эти корзины приобрели зловещую известность после ареста главы Минэкономразвития Алексея Улюкаева в 2016 году — тогда министра с корзиной колбасы задержали в офисе «Роснефти», а в полученной им от Сечина сумке нашли 2 млн долларов). К статье привязаны персоны «Игорь Сечин», «Алексей Улюкаев», а также компании Роснефть, Транснефть, Ростелеком и Русгидро.
Таким образом, из сайта достаточно легко извлечь информацию об упоминаниях людей и компаний, в том числе совместных. Для каждого человека есть отдельная страница, с которой доступны все тексты с упоминанием человека. Всего в RuCompromat свыше 11 тысяч персоналий.
В базе компромата размечены упоминания людей в компрометирующих материалах. Иногда люди упоминаются вместе — как Сечин с Улюкаевым в примере выше. Из таких данных легко извлечь «сеть совместной встречаемости»: узлом сети становится человек, а связью между двумя людьми — факт совместного упоминания в компрометирующей статье.
Именно такую сеть и построили исследователи. В ней получилось 11118 узлов (по числу людей в базе) и 37544 связи. Связь означает, что люди упоминаются в одних и тех же материалах. Связи не имеют направлений и весов — таким образом, модель предельно простая.
Зачем вообще ученым нужна сеть как модель? Во-первых, сеть хорошо показывает важность отдельного узла на основе метрик центральности. Сколько у узла связей, сколько связей проходит через него, сколько связей у тех, с кем он связан и т.п. — все это формализуется через разные центральности. Мы подробно рассказывали о центральностях здесь.
В этой работе центральности интерпретировались так:
Владимир Путин оказался в центре сети по всем возможным показателям центральности. У него больше всех связей (т.е. самая высокая степень), он в среднем ближе всех к другим узлам (наивысшая центральность по близости, closeness centrality), он самый главный промежуточный узел (betweenness centrality) и конечно, он же оказался самым «токсичным» (eigenvector centrality)
Далее в топе токсичности — Дмитрий Медведев, Игорь Сечин, Сергей Чемезов и Аркадий Ротенберг. Что характерно, все они — старые питерские друзья Путина, приведенные им во власть. А вот, к примеру, Сергей Собянин в список «токсичных» не входит, зато он имеет высокую центральность по посредничеству («типичность»). Очевидно, Собянин реже попадает под огонь компромата, а если попадает, то не вместе с наиболее «токсичной» питерской группой.
Кстати о группах. Кроме центральностей, сети хорошо отображают группировку сообществ. Если какое-то множество узлов в сети образует тесно переплетенный клубок (т.е. имеют множество связей между собой — и немного связей ), то алгоритмы выделения сообществ их найдут и подсветят.
Как отмечают авторы исследования, в этой сети хорошо видна модульная структура и выделяются четкие сообщества. В сети выделилось 33 крупных сообщества, которые затем были сгруппированы по профессиональной принадлежности их членов: политики, банкиры, журналисты, чиновники, силовики и т.п.
Как правило, компромат объединял в сообщества людей из одной группы: банкиры с другими банкирами, политики с другими политиками. В то же время многие сообщества оказались смешанными. Единственная группа, которая изолировалась от других, — силовики. Как отмечают авторы исследования, » такая разница позволяет предположить, что случаи компромата против силовиков отличаются от тех, которые связаны с политическим или экономическим блоком». Вероятно, в России, где силовики давно оформились в отдельную правящую касту, и компромат для них делают особый — по спецзаказу.
Zinoviev D. A Social Network of Russian “Kompromat”
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…