Визуализация социальных связей Фрэнсиса Бэкона

Проект Six Degrees of Francis Bacon («Шесть рукопожатий Фрэнсиса») создан совместными усилиями Университета Карнеги — Меллона и Джорджтаунского университета. Это хороший пример того, как цифровые технологии могут использоваться в гуманитарных дисциплинах. На сайте можно проследить связи Бэкона с самыми разными историческими деятелями того времени: от короля Англии Якова I до философа Томаса Гоббса и драматурга Уильяма Шекспира.

Томас Гоббс, Яков I и не только

В проекте можно изучить не только персональные социальные сети выдающихся людей Англии Нового времени, таких как Шекспир, Ньютон или Мильтон, но и своего рода «корпоративные» соцсети. Например, так выглядит социальная сеть английских корсаров. Видите в ней Фрэнсиса Дрейка, легендарную грозу морей на службе Елизаветы I?

Социальная сеть английских корсаров

Построение социальной сети Бэкона

Нужно было найти источник социальных связей, обработать их, на этой основе создать социальный граф наконец проверить достоверность полученных результатов.

Источником социальных связей Бэкона стали биографии Бэкона и его современников, опубликованные на сайте Oxford Dictionary of National Biography. Этот библиографический словарь существует с середины XIX века и описывает более 60 тыс. биографий известных британских деятелей. В начале 2000-х Oxford Dictionary of National Biography оцифровали.

Исследователи отобрали из этого словаря всех, живших между 1500 и 1700 гг. Получилось 13 000 человек — узлов будущей социальной сети — но не все из них были на самом деле связаны с Фрэнсисом Бэконом. Дальше тексты статей были предварительно автоматически обработаны: были выделены и размечены имена внутри текста, названия организаций, даты и места. Получилась общая таблица, описывающая, в каком контексте упоминается каждая из отобранных персоналий: кто связан с этим человеком, где и когда он бывал. Эта информация позволила связать отобранные персоналии между собой.

Социальная сеть Уильяма Шекспира; видны супруга драматурга Энн Хэтэуэй, их дети, а также легендарный коллега Шекспира по цеху (и вероятный соавтор) Кристофер Марло

Дальше исследователи уменьшили общее число имен. Во-первых, были убраны имена, которые упоминались только в текстах статей, но не были в заголовках статей; во-вторых, были отброшены те, которые встречались меньше, чем в пяти документах. На последнем этапе список проверили вручную, чтобы избежать ситуаций, когда два человека с совпадающими именами оказались записаны как один, и чтобы объединить имена, записанные по-разному.

Легко предположить, что если имена упоминаются вместе, то реальные исторические персонажи каким-то образом связаны между собой или даже знакомы. Чем чаще они встречаются вместе, тем больше вероятность, что наши ожидания верны. На основе этого предположения исследователи построили матрицу корреляций, которая показывала связь и значимость этой связи между каждым из имен. Эта матрица и послужила основой для первоначальной графической визуализации. Тем не менее, для нее требовалась дополнительная проверка.

Проверка результатов

Для проверки полученного графа использовался LDA-алгоритм (LDA — это латентное размещение Дирихле). При использовании этого алгоритма каждый документ рассматривается как набор нескольких тем, каждая из которых выражена определенными ключевыми словами. Исследователи использовали этот алгоритм и выделили темы и группы слов, которые их описывали. Таким образом можно было проверить связаны ли имена между собой не только совместными упоминаниями, но и общими темами. Например, если два человека упоминаются вместе и они оба появляются в контексте пятой темы, то можно предположить, что это два поэта, которые знакомы между собой. Кроме того, для двенадцати персоналий окружающий их граф был проверен вручную.

Шесть самых упоминаемых слов для модели из десяти тем

В результате этого исследования появился интерактивный граф, который опубликован на сайте проекта. Шесть рукопожатий Фрэнсиса Бэкона могут завести нас достаточно далеко даже в Англии Нового времени. Весьма вероятно, что Фрэнсис Бэкон, среди прочего разработавший индуктивный метод научных исследований, одобрил бы подобный подход.

Соцсеть Исаака Ньютона; среди прочих в ней есть знаменитый физик Роберт Гук (помните, в школе рассказывали про закон Гука?). С Гуком у Ньютона был тяжелый спор о том, кто первый открыл закон всемирного тяготения. Многие и сегодня отдают приоритет Гуку. Бесспорно, что без влияния Гука Ньютон не продолжил бы работу по изучению тяготения

Источники

  • Warren, C. N., Shore, D., Otis, J., Wang, L., Finegold, M., & Shalizi, C. (2016). Six Degrees of Francis Bacon: A Statistical Method for Reconstructing Large Historical Social Networks. DHQ: Digital Humanities Quarterly, 10(3).
  • sixdegreesoffrancisbacon.com

P.S. Если вас интересует применение социальных сетей в гуманитарных науках, вам могут понравиться наши посты о сетевых исследованиях русских пьес (первый и второй).