Когда мы говорим об изучении социальных сетей, то сразу представляем что-то вроде таких картинок:
Это «твиттосфера» избирателей в США от MIT Media Lab. Красным цветом отображены те, кто фолловит только аккаунт Трампа, голубым — только Клинтон. Розовый цвет означает, что человек подписан на оба аккаунта, а серый — что ни на один.
Социальные сети изучали еще до появления фейсбука и даже до появления интернета, а их анализ широко применяется в вирусологии.
1. Социальные сети: не только в твоем смартфоне
В социальных науках с начала XX века социальные сети служили метафорой наших взаимодействий друг с другом.Так, в 30-е Якоб Морено моделировал с помощью сетей школьные сообщества, а в 50-е тем же занялись антропологи, изучающие племенные группы (например, Макс Глакман и его манчестерская группа).
Позже знаменитый французский социолог Пьер Бурдье называл структуру общественных отношений социальной сетью. Его соотечественник, социолог Бруно Латур создал вместе с единомышленниками так называемую акторно-сетевую теорию, для которой модель сети также является важной.
С распространением в социальных науках математической теории графов социальную структуру стали чаще изображать как-то так:
Предположим, тут изображены дружеские отношения небольшой группы людей. Кто-то дружит компанией, а кто-то — как Allen и Lisa — только с одним человеком или парой.
До развития анализа социальных сетей одной из важнейшей проблем социологии было некоторое несоответствие теории и методов. Социологическая теория рассматривала акторов (то есть людей) и их взаимодействие, тогда как социологические методы изучали переменные (характеризующие акторов: пол, профессия, зарплата и так далее) и их взаимодействие между собой. А анализ социальных сетей, как раз фокусирующийся на связи между акторами, объединенными в общую систему, позволяет эту проблему преодолеть.
Значим ли ты?
Акцент делается на связи между людьми. Важный момент: каждая связь должна рассматриваться не сама по себе, а как одна из связей в системе. По-английски эти связи называются links, или edges (ребра графа).
Люди в системе — nodes (узлы), или vertices (vertex — вершина), могут быть рассмотрены с точки зрения их места в системе связей. Чтобы оценить значимость индивидов в социальной сети, считают следующие показатели: степень центральности (degree centrality),степень посредничества (betweenness centrality), степень близости (closeness centrality) и степень влиятельности (eigenvector centrality).
2.1 Cтепень центральности (degree centrality)
Сначала можно подумать, что наиболее значимый индивид в сети тот, у кого больше всего связей. Посмотрим еще раз на дружеские связи группы людей:
Очевидно, что у Jill больше всего контактов, а значит, у нее скорее всего довольно большое влияние на других. Можно посчитать degree centrality каждого индивида в сети, которое равно количеству прямых связей каждого индивида, и убедиться в этом: у Jill оно равно шести, а у Liz, например, трем.
2.2 Cтепень посредничества (betweenness centrality)
Но на самом деле, не только количество связей, но и положение в сети может нам рассказать о значимости индивида.
Например, в этой сети Liz занимает стратегическое положение: она связывает довольно плотную дружескую группу слева от нее с парой друзей Allen и Lisa, в эту большую группу не вписывающихся. Получается, что Liz в большей степени, чем Jill, может контролировать передачу информации по всей сети. Посчитать это можно с помощью степени посредничества. Для Liz она будет равна числу наикратчайших путей между всеми парами индивидов сети, проходящих через Liz, поделенное на суммарное число всех наикратчайших путей между всеми индивидами. Наикратчайший путь для пары индивидов — это наименьшее количество связей, через которые можно пройти в сети от одного индивида к другому.
2.3 Степень близости (closeness centrality)
Или, скажем, Shane и Emma с первого взгляда не кажутся такими уж значимыми в сети. При этом они находятся на наиболее близком расстоянии до всех других участников сети.
Если для каждого индивида просуммировать все связи в путях от него до всех остальных индивидов, у Shane и Emma это количество будет наименьшим. Значит, они, возможно, быстрее всех получают доступ к информации в сети, и у них есть возможность напрямую передавать эту информацию.
2.4 Cтепень влиятельности (eigenvector centrality)
Те индивиды, у которых не только много связей, но и выгодное положение в сети, будут наиболее влиятельными.
Jill, Shane, Emma и Liz дружат с наиболее «связанными» индивидами (которых мы обозначили исходя из предыдущих показателей). Они могут общаться с наиболее активными и/или влиятельными индивидами в сети, а значит, они находятся во властной позиции.
Считают это через собственный вектор, или eigenvector (помните линейную алгебру? Если нет, то Википедия вам в помощь).
Кстати, все эти метрики используются и при анализе литературы — «Системный Блокъ» рассказывал об этом здесь и здесь. А теперь вернемся к общественным проблемам.
2. А причем тут коронавирус?
Теперь представим, что в социальной сети передается не информация, а вирус. Через подсчет всех этих показателей значимости индивидов можно быстрее идентифицировать точки распространения болезни и легче остановить эпидемию.
На этом рисунке показана социальная сеть вспышки туберкулеза, случившейся в Америке больше десяти лет назад. Передача туберкулеза, как и COVID-19, происходит воздушно-капельным путем или через поверхности в непосредственной близости от инфицированных. Черные точки — это заболевшие и заражающие других. Связи между точками — это контакты между людьми.
После идентификации инфицированного индивида нужно протестировать все его недавние контакты, чтобы выявить других заболевших. Зеленые точки — те, кого протестировали, но они оказались не зараженными, а розовые — те, кто заразился. Серые точки — те, кого еще не протестировали.
Встает вопрос: кого сейчас нужно тестировать в приоритетном порядке? Это обведенные красным серые точки. Как понять, что нужно тестировать именно их? Через подсчет показателей значимости индивидов в сети.
Те индивиды, у которых выше степень центральности, степень посредничества, степень близости и степень влиятельности с большей вероятностью окажутся разносчиками болезни. У них больше контактов в принципе, но особенно с инфицированными. Они занимают «стратегическую» позицию в сети, находясь в непосредственной близости от двух или трех переносчиков болезни — черных точек.