Что такое сетевой анализ?
Сетевой анализ (network analysis), появившийся в социологии для изучения сообществ, предполагает представление информации в виде сети, или математических графов. Объекты в сетевом анализе называют вершинами или узлами, а связи между ними — ребрами или дугами. На картинке ниже представлен пример сети персонажей пьесы А. С. Пушкина «Скупой рыцарь». Такой способ визуализации не только помогает быстрее проанализировать любое литературное произведение, но и предлагает новое видение классического сюжета. Чтобы узнать больше о том, как и для чего применять сетевой анализ, можете прочитать наш разбор здесь.
Два способа анализа сетей персонажей: диалоговый и метод соседства
Для анализа персонажей было необходимо сначала разметить все их упоминания и границы их реплик с указанием на адресата и адресанта сообщений. Есть два метода анализа сетей персонажей ― диалоговый и метод соседства. Первый предполагает, что персонажи напрямую друг с другом взаимодействуют (разговаривают). Второй метод позволяет выстраивать связи героев на основании их упоминаний рядом друг с другом (в этой работе — в одном предложении).
На первом этапе исследования сети строились для всего произведения целиком. Были построены две взвешенные сети персонажей: на основе диалогового метода (далее — Д-сеть) и на основе метода соседства (далее — С-сеть). Взвешенная сеть — это сеть, у ребер которой может быть разный вес (на картинке — толщина). Чем больше взаимодействовали персонажи (чем чаще разговаривали, чем чаще встречались в тексте рядом), тем выше вес связи (и толще ребро) между ними.
Персонажи «войны» и «мира» — кто главнее
Во всем «Войне и мире» очень много персонажей, поэтому сети всего произведения получаются очень большими. Рассматривать их целиком сложно, поэтому мы рассмотрим только их «ядро» — части или подграфы, включающие основных персонажей эпопеи.
Эти подграфы выделены из графов на основе центральности, а именно метрики Eigenvector centrality, которую еще можно назвать центральностью собственного вектора или «влиятельности». Она показывает важность персонажа, учитывая влиятельность персонажей, с которыми он взаимодействует (чем больше узел персонажа, тем более он влиятелен). О разных метриках центральности узлов в сети мы подробно рассказывали вот в этом материале.
На рисунках ниже мы видим по десять наиболее влиятельных персонажей. Заметно, что картина меняется в зависимости от применяемого метода. Слева Д-сеть (то есть построенная диалоговым методом) отображает меньше военно-исторических персонажей («персонажей войны») в качестве главных во всей эпопее (Кутузова, Наполеона, Александра I) в отличие от С-сети (метод соседства) справа — там вместо них «персонажи мира» Василий Курагин, графиня Ростова и Денисов.
Посмотрим на сети, полученные с помощью двух других метрик, и сравним результаты. Теория о том, что центральное место занимают исторические участники Отечественной войны, подтверждается с помощью метрики центральности «центральность по посредничеству» (Betweenness centrality). Она показывает, насколько связующим является узел, и определяется как сумма вероятностей встретить эту вершину на кратчайшем пути между двумя другими. В топ-10 персонажей попадают Наполеон и Кутузов, а на С-сети Кутузов и вовсе становится самым значимым персонажем. Через него связаны множество генералов, адъютантов, и одновременно с ним пересекаются многие мирные персонажи.
И наконец, метрика «Взвешенная степень» (Weighted degree, strength), напротив, дает меньший вес военно-историческим персонажам и выводит на первый план героев «мира» — Пьера, Наташу, Николая. Эта метрика учитывает количество соседних вершин и веса ребер, то есть и количество персонажей, с которыми взаимодействует герой, и количество взаимодействий с каждым.
Центральность собственного вектора оказалась удачным промежуточным вариантом — по ней военные персонажи не оказались совсем на периферии, но и не вышли на самый первый план.
Чтобы обобщить центральность, был применен метод обратных ранговых значений. Для каждой метрики десяти персонажам с наиболее высокими показателями центральности присвоили ранг (ранг 10 значит первое место по указанной центральности, ранг 9 — второе место и далее). Показатели по всем трем сетям были суммированы, и так для каждого персонажа получили его совокупный ранг в каждой сети. Совокупные ранги центральных персонажей в двух видах сетей (Д-сетях и С-сетях) — на рисунке ниже.
Военно-исторические персонажи имеют немного разные позиции в разных типах сетей — у Александра I, Кутузова, Наполеона более высокие центральности в С-сети. В Д-сети по сравнению с С-сетью выше позиции Наташи Ростовой, графини Ростовой, Николая, Денисова, Марьи, Долохова.
Выделение сообществ персонажей «Войны и мира»
Кроме анализа отдельных персонажей можно рассмотреть, какие в произведении выделяются сообщества героев и как они взаимодействуют. Выделение сообществ — еще один раздел сетевого анализа, у него есть разные методы, и в этом исследовании применялся алгоритм оптимизации модулярности.
При диалоговом методе (Д-сеть) кластеры (другое название сообществ) группируются вокруг одного из главных персонажей. В центре сети, то есть в месте пересечения разных сообществ, оказываются Пьер, а также Наташа и Николай Ростовы. Можно утверждать, что они становятся «связующим звеном» между разными группами героев посредством диалогов с ними. В меньшей степени это относится к Андрею Болконскому, хотя он тоже расположен в центре кластеров.
Метод соседства (С-сеть) отражает четыре крупных группы ― военное сообщество, Болконские, Ростовы, а также Курагины, Друбецкие и Пьер как один кластер. Здесь в центре пересечения ярче выделяются Андрей Болконский и Пьер Безухов. Интересно, что часть персонажей на военной службе оказались не в военном сообществе (самом крупном из четырех), а в кластере Ростовых ― кроме Николая, сюда попали Денисов и Долохов.
Результаты извлечения сообществ в обеих сетях показывают ограничения сетевого анализа в художественных произведениях такого масштаба, как «Война и мир». Не всегда можно определить единственную роль персонажа, который на протяжении повествования развивается и попадает в разные группы. Кроме того, сжатие романа-эпопеи в статичную сеть приводит к наслоению информации из разных временных отрезков. Например, в Д-сети вокруг Болконского одновременно группируются обитатели Лысых Гор (родовое поместье героя), военная общность и светское общение Лизы Болконской, а также кружок Сперанского. То же касается сообществ Пьера Безухова и Николая Ростова. В С-сети эта проблема тоже присутствует, но выражена не так отчетливо. Решение такого «наслоения» ― попытка использовать сети для отдельных фрагментов книги.
Например, можно рассмотреть сети Эпилога. В обеих сетях выделилось два главных сообщества вокруг двух ключевых пар эпилога: Наташи с Пьером и Марьи с Николаем. Так структуры сетей на разных уровнях текста отражают «совершенно различные миры», существующие внутри большой семьи. И Д-сеть вновь не отобразила историческую составляющую системы персонажей: там нет Наполеона, Александра I и упоминаемых вместе с ним политических деятелей, которые в С-сети образуют отдельное сообщество.
О чем говорит плотность сетей
Наконец, был проанализирован еще один параметр сетей — их плотность. Плотность сети (графа) вычисляется как отношение числа связей в сети к максимально возможному количеству связей внутри этой сети. Таким образом, она показывает, насколько тесно связаны узлы в графе.
По графикам ниже, например, можно заметить, что в Д-сети наивысшая концентрация персонажей — в Эпилоге. Как уже было отмечено, Д-сеть демонстрирует смещение в сторону семейно-бытовых отношений, а в эпилоге как раз описывается жизнь большого семейства, включившего «в себя прежних Ростовых, Болконских, Пьера Безухова». А в С-сети наименьшая концентрация персонажей — во время Бородинского сражения. В целом статистика обеих сетей показывает, что во всех военных эпизодах количество взаимодействия между персонажами снижается (Шенграбенское сражение, Аустерлиц, описания войны после Бородина).
Что в итоге?
Сетевой анализ в литературе позволяет делить персонажей на подвижные сообщества в зависимости от их взаимодействий друг с другом. Кроме того, он позволяет определять центральных героев, а также их «плотность» ― насколько много или мало людей представлено в повествовании. Новая оптика позволяет лучше понять смысл любого произведения, хотя она подходит не во всех случаях. Например, для эффективного анализа такое масштабное произведение как «Война и мир» приходится делить на части, то есть нет возможности получить единый разбор всего романа-эпопеи. Сравнивая два способа сетевого анализа, можно сделать вывод, что если диалоговый метод отличается фактической точностью (диалоги способны точно отражать отдельные социальные группы, например, конкретные семьи), то преимущество метода соседства заключается в сбалансированности: если в диалоговых сетях на первый план выходят в основном персонажи мира, то в сетях соседства достаточно представлены и персонажи войны. Последние не менее важны для автора, хоть в них и не так много диалогов. Итак, в «Войне и мире» диалоговые сети больше помогают понять межличностные взаимоотношения персонажей и обращают наше внимание на «мир», а сети соседства позволяют исследовать и «войну».