![](https://sysblok.ru/wp-content/uploads/2020/01/image3-2.jpg)
Проект Six Degrees of Francis Bacon («Шесть рукопожатий Фрэнсиса») создан совместными усилиями Университета Карнеги — Меллона и Джорджтаунского университета. Это хороший пример того, как цифровые технологии могут использоваться в гуманитарных дисциплинах. На сайте можно проследить связи Бэкона с самыми разными историческими деятелями того времени: от короля Англии Якова I до философа Томаса Гоббса и драматурга Уильяма Шекспира.
![](https://sysblok.ru/wp-content/uploads/2020/01/image5-1.jpg)
В проекте можно изучить не только персональные социальные сети выдающихся людей Англии Нового времени, таких как Шекспир, Ньютон или Мильтон, но и своего рода «корпоративные» соцсети. Например, так выглядит социальная сеть английских корсаров. Видите в ней Фрэнсиса Дрейка, легендарную грозу морей на службе Елизаветы I?
![](https://sysblok.ru/wp-content/uploads/2020/01/image1-5.png)
Построение социальной сети Бэкона
Нужно было найти источник социальных связей, обработать их, на этой основе создать социальный граф наконец проверить достоверность полученных результатов.
Источником социальных связей Бэкона стали биографии Бэкона и его современников, опубликованные на сайте Oxford Dictionary of National Biography. Этот библиографический словарь существует с середины XIX века и описывает более 60 тыс. биографий известных британских деятелей. В начале 2000-х Oxford Dictionary of National Biography оцифровали.
Исследователи отобрали из этого словаря всех, живших между 1500 и 1700 гг. Получилось 13 000 человек — узлов будущей социальной сети — но не все из них были на самом деле связаны с Фрэнсисом Бэконом. Дальше тексты статей были предварительно автоматически обработаны: были выделены и размечены имена внутри текста, названия организаций, даты и места. Получилась общая таблица, описывающая, в каком контексте упоминается каждая из отобранных персоналий: кто связан с этим человеком, где и когда он бывал. Эта информация позволила связать отобранные персоналии между собой.
![](https://sysblok.ru/wp-content/uploads/2020/01/image2-7-1024x613.jpg)
Дальше исследователи уменьшили общее число имен. Во-первых, были убраны имена, которые упоминались только в текстах статей, но не были в заголовках статей; во-вторых, были отброшены те, которые встречались меньше, чем в пяти документах. На последнем этапе список проверили вручную, чтобы избежать ситуаций, когда два человека с совпадающими именами оказались записаны как один, и чтобы объединить имена, записанные по-разному.
Легко предположить, что если имена упоминаются вместе, то реальные исторические персонажи каким-то образом связаны между собой или даже знакомы. Чем чаще они встречаются вместе, тем больше вероятность, что наши ожидания верны. На основе этого предположения исследователи построили матрицу корреляций, которая показывала связь и значимость этой связи между каждым из имен. Эта матрица и послужила основой для первоначальной графической визуализации. Тем не менее, для нее требовалась дополнительная проверка.
Проверка результатов
Для проверки полученного графа использовался LDA-алгоритм (LDA — это латентное размещение Дирихле). При использовании этого алгоритма каждый документ рассматривается как набор нескольких тем, каждая из которых выражена определенными ключевыми словами. Исследователи использовали этот алгоритм и выделили темы и группы слов, которые их описывали. Таким образом можно было проверить связаны ли имена между собой не только совместными упоминаниями, но и общими темами. Например, если два человека упоминаются вместе и они оба появляются в контексте пятой темы, то можно предположить, что это два поэта, которые знакомы между собой. Кроме того, для двенадцати персоналий окружающий их граф был проверен вручную.
![](https://sysblok.ru/wp-content/uploads/2020/01/image4-2-1.jpg)
В результате этого исследования появился интерактивный граф, который опубликован на сайте проекта. Шесть рукопожатий Фрэнсиса Бэкона могут завести нас достаточно далеко даже в Англии Нового времени. Весьма вероятно, что Фрэнсис Бэкон, среди прочего разработавший индуктивный метод научных исследований, одобрил бы подобный подход.
![](https://sysblok.ru/wp-content/uploads/2020/01/image6-1-1024x822.jpg)
Источники
- Warren, C. N., Shore, D., Otis, J., Wang, L., Finegold, M., & Shalizi, C. (2016). Six Degrees of Francis Bacon: A Statistical Method for Reconstructing Large Historical Social Networks. DHQ: Digital Humanities Quarterly, 10(3).
- sixdegreesoffrancisbacon.com
P.S. Если вас интересует применение социальных сетей в гуманитарных науках, вам могут понравиться наши посты о сетевых исследованиях русских пьес (первый и второй).