Читать нас в Telegram
анализ персонажей войны и мир
Иллюстрация: Юлия Бобкова

Что такое сетевой анализ?

Сетевой анализ (network analysis), появившийся в социологии для изучения сообществ, предполагает представление информации в виде сети, или математических графов. Объекты в сетевом анализе называют вершинами или узлами, а связи между ними — ребрами или дугами. На картинке ниже представлен пример сети персонажей пьесы А. С. Пушкина «Скупой рыцарь». Такой способ визуализации не только помогает быстрее проанализировать любое литературное произведение, но и предлагает новое видение классического сюжета. Чтобы узнать больше о том, как и для чего применять сетевой анализ, можете прочитать наш разбор здесь.

Сетевой анализ пьесы А. С. Пушкина «Скупой рыцарь»
Сетевой анализ пьесы А. С. Пушкина «Скупой рыцарь». Источник: СБъ 

Два способа анализа сетей персонажей: диалоговый и метод соседства

Для анализа персонажей было необходимо сначала разметить все их упоминания и границы их реплик с указанием на адресата и адресанта сообщений. Есть два метода анализа сетей персонажей ― диалоговый и метод соседства. Первый предполагает, что персонажи напрямую друг с другом взаимодействуют (разговаривают). Второй метод позволяет выстраивать связи героев на основании их упоминаний рядом друг с другом (в этой работе — в одном предложении). 

На первом этапе исследования сети строились для всего произведения целиком. Были построены две взвешенные сети персонажей: на основе диалогового метода (далее — Д-сеть) и на основе метода соседства (далее — С-сеть). Взвешенная сеть — это сеть, у ребер которой может быть разный вес (на картинке — толщина). Чем больше взаимодействовали персонажи (чем чаще разговаривали, чем чаще встречались в тексте рядом), тем выше вес связи (и толще ребро) между ними.

Персонажи «войны» и «мира» — кто главнее 

Во всем «Войне и мире» очень много персонажей, поэтому сети всего произведения получаются очень большими. Рассматривать их целиком сложно, поэтому мы рассмотрим только их «ядро» — части или подграфы, включающие основных персонажей эпопеи. 

Эти подграфы выделены из графов на основе центральности, а именно метрики Eigenvector centrality, которую еще можно назвать центральностью собственного вектора или «влиятельности». Она показывает важность персонажа, учитывая влиятельность персонажей, с которыми он взаимодействует (чем больше узел персонажа, тем более он влиятелен). О разных метриках центральности узлов в сети мы подробно рассказывали вот в этом материале

На рисунках ниже мы видим по десять наиболее влиятельных персонажей. Заметно, что картина меняется в зависимости от применяемого метода. Слева Д-сеть (то есть построенная диалоговым методом) отображает меньше военно-исторических персонажей («персонажей войны») в качестве главных во всей эпопее (Кутузова, Наполеона, Александра I) в отличие от С-сети (метод соседства) справа — там вместо них «персонажи мира» Василий Курагин, графиня Ростова и Денисов. 

Д-сеть (слева) и С-сеть (справа) персонажей «Войны и мира»
Д-сеть (слева) и С-сеть (справа) персонажей «Войны и мира»

Посмотрим на сети, полученные с помощью двух других метрик, и сравним результаты. Теория о том, что центральное место занимают исторические участники Отечественной войны, подтверждается с помощью метрики центральности «центральность по посредничеству» (Betweenness centrality). Она показывает, насколько связующим является узел, и определяется как сумма вероятностей встретить эту вершину на кратчайшем пути между двумя другими. В топ-10 персонажей попадают Наполеон и Кутузов, а на С-сети Кутузов и вовсе становится самым значимым персонажем. Через него связаны множество генералов, адъютантов, и одновременно с ним пересекаются многие мирные персонажи.

Сетевой анализ персонажей «Войны и мира» с помощью центральности по посредничеству. Д-сеть (слева) и С-сеть (справа)
Анализ персонажей «Войны и мира» с помощью центральности по посредничеству. Д-сеть (слева) и С-сеть (справа)

И наконец, метрика «Взвешенная степень» (Weighted degree, strength), напротив, дает меньший вес военно-историческим персонажам и выводит на первый план героев «мира» — Пьера, Наташу, Николая. Эта метрика учитывает количество соседних вершин и веса ребер, то есть и количество персонажей, с которыми взаимодействует герой, и количество взаимодействий с каждым. 

Сетевой анализ персонажей «Войны и мира» с помощью взвешенной степени
Анализ персонажей «Войны и мира» с помощью взвешенной степени

Центральность собственного вектора оказалась удачным промежуточным вариантом — по ней военные персонажи не оказались совсем на периферии, но и не вышли на самый первый план. 

Чтобы обобщить центральность, был применен метод обратных ранговых значений. Для каждой метрики десяти персонажам с наиболее высокими показателями центральности присвоили ранг (ранг 10 значит первое место по указанной центральности, ранг 9 — второе место и далее). Показатели по всем трем сетям были суммированы, и так для каждого персонажа получили его совокупный ранг в каждой сети. Совокупные ранги центральных персонажей в двух видах сетей (Д-сетях и С-сетях) — на рисунке ниже.

Обобщенные ранги персонажей в двух типах сетей
 Обобщенные ранги персонажей в двух типах сетей

Военно-исторические персонажи имеют немного разные позиции в разных типах сетей — у Александра I, Кутузова, Наполеона более высокие центральности в С-сети. В Д-сети по сравнению с С-сетью выше позиции Наташи Ростовой, графини Ростовой, Николая, Денисова, Марьи, Долохова. 

Выделение сообществ персонажей «Войны и мира»

Кроме анализа отдельных персонажей можно рассмотреть, какие в произведении выделяются сообщества героев и как они взаимодействуют. Выделение сообществ — еще один раздел сетевого анализа, у него есть разные методы, и в этом исследовании применялся алгоритм оптимизации модулярности

При диалоговом методе (Д-сеть) кластеры (другое название сообществ) группируются вокруг одного из главных персонажей. В центре сети, то есть в месте пересечения разных сообществ, оказываются Пьер, а также Наташа и Николай Ростовы. Можно утверждать, что они становятся «связующим звеном» между разными группами героев посредством диалогов с ними. В меньшей степени это относится к Андрею Болконскому, хотя он тоже расположен в центре кластеров.

Выделение сообществ в сети персонажей «Войны и мира», построенной на основе
диалоговых взаимодействий (сообщества отмечены цветами)
Выделение сообществ в сети персонажей «Войны и мира», построенной на основе
диалоговых взаимодействий (сообщества отмечены цветами)

Метод соседства (С-сеть) отражает четыре крупных группы ― военное сообщество, Болконские, Ростовы, а также Курагины, Друбецкие и Пьер как один кластер. Здесь в центре пересечения ярче выделяются Андрей Болконский и Пьер Безухов. Интересно, что часть персонажей на военной службе оказались не в военном сообществе (самом крупном из четырех), а в кластере Ростовых ― кроме Николая, сюда попали Денисов и Долохов.

Выделение сообществ в С-сети (сети персонажей «Войны и мира» на основе
совместной встречаемости)
Выделение сообществ в С-сети (сети персонажей «Войны и мира» на основе
совместной встречаемости)

Результаты извлечения сообществ в обеих сетях показывают ограничения сетевого анализа в художественных произведениях такого масштаба, как «Война и мир». Не всегда можно определить единственную роль персонажа, который на протяжении повествования развивается и попадает в разные группы. Кроме того, сжатие романа-эпопеи в статичную сеть приводит к наслоению информации из разных временных отрезков. Например, в Д-сети вокруг Болконского одновременно группируются обитатели Лысых Гор (родовое поместье героя), военная общность и светское общение Лизы Болконской, а также кружок Сперанского. То же касается сообществ Пьера Безухова и Николая Ростова. В С-сети эта проблема тоже присутствует, но выражена не так отчетливо. Решение такого «наслоения» ― попытка использовать сети для отдельных фрагментов книги.

Например, можно рассмотреть сети Эпилога. В обеих сетях выделилось два главных сообщества вокруг двух ключевых пар эпилога: Наташи с Пьером и Марьи с Николаем. Так структуры сетей на разных уровнях текста отражают «совершенно различные миры», существующие внутри большой семьи. И Д-сеть вновь не отобразила историческую составляющую системы персонажей: там нет Наполеона, Александра I и упоминаемых вместе с ним политических деятелей, которые в С-сети образуют отдельное сообщество.

Персонажи «Войны и мира«. Д-сеть, размер узла пропорционален центральности собственного вектора, цветами обозначены результаты деления графа на сообщества
Д-сеть, размер узла пропорционален центральности собственного вектора, цветами обозначены результаты деления графа на сообщества

Персонажи «Войны и мира«. С-сеть, размер узла пропорционален центральности собственного вектора, цветами обозначены результаты деления графа на сообщества.
С-сеть, размер узла пропорционален центральности собственного
вектора, цветами обозначены результаты деления графа на сообщества

О чем говорит плотность сетей

Наконец, был проанализирован еще один параметр сетей — их плотность. Плотность сети (графа) вычисляется как отношение числа связей в сети к максимально возможному количеству связей внутри этой сети. Таким образом, она показывает, насколько тесно связаны узлы в графе. 

По графикам ниже, например, можно заметить, что в Д-сети наивысшая концентрация персонажей — в Эпилоге. Как уже было отмечено, Д-сеть демонстрирует смещение в сторону семейно-бытовых отношений, а в эпилоге как раз описывается жизнь большого семейства, включившего «в себя прежних Ростовых, Болконских, Пьера Безухова». А в С-сети наименьшая концентрация персонажей — во время Бородинского сражения. В целом статистика обеих сетей показывает, что во всех военных эпизодах количество взаимодействия между персонажами снижается (Шенграбенское сражение, Аустерлиц, описания войны после Бородина). 

Плотность персонажей «Войны и мира» в Д-сети
Плотность персонажей в Д-сети

Плотность персонажей «Войны и мира» в С-сети
Плотность персонажей в С-сети

Что в итоге?

Сетевой анализ в литературе позволяет делить персонажей на подвижные сообщества в зависимости от их взаимодействий друг с другом. Кроме того, он позволяет определять центральных героев, а также их «плотность» ― насколько много или мало людей представлено в повествовании. Новая оптика позволяет лучше понять смысл любого произведения, хотя она подходит не во всех случаях. Например, для эффективного анализа такое масштабное произведение как «Война и мир» приходится делить на части, то есть нет возможности получить единый разбор всего романа-эпопеи. Сравнивая два способа сетевого анализа, можно сделать вывод, что если диалоговый метод отличается фактической точностью (диалоги способны точно отражать отдельные социальные группы, например, конкретные семьи), то преимущество метода соседства заключается в сбалансированности: если в диалоговых сетях на первый план выходят в основном персонажи мира, то в сетях соседства достаточно представлены и персонажи войны. Последние не менее важны для автора, хоть в них и не так много диалогов. Итак, в «Войне и мире» диалоговые сети больше помогают понять межличностные взаимоотношения персонажей и обращают наше внимание на «мир», а сети соседства позволяют исследовать и «войну».

Источник: Скоринкин Д. А. Семантическая разметка художественных текстов для количественных исследований в филологии (на примере романа «Война и мир» Л. Н. Толстого): дис. …канд. фил. наук: 10.02.21. — Высшая школа экономики, Москва, 2018 — 164 с.