Читать нас в Telegram
Иллюстратор: Настя Лобова

Исследовательница-медиевистка Евгения Шелина давно занимается анализом текстов средневековых европейских властей. В 2020 году при помощи текстометрической платформы TXM и языка программирования R она проанализировала [1] тексты представителей французской аристократии XIII века. Платформа TXM использовалась для анализа текстов и текстовых корпусов, в то время как язык R применялся здесь для факторного анализа (статистический метод, который позволяет обобщать значения признаков, выделяя наиболее важные). Под средневековой аристократией в работе понимается как религиозная (епископы, аббаты), так и светская (короли, графы) знать. 

Тема исследования расположена на стыке дисциплин. С одной стороны это исследование лежит в области лингвистики, поскольку здесь широко используется модель «семантического поля» (т.е. группы слов, имеющий общую часть значения, называемую еще семантическим признаком; например, глаголы говорить, шептаться, трындеть, балакать, трепаться все относятся к семантическому полю «произнесение речи, говорение»). С другой — это работа по истории средневековой Европы. Кроме того, не обходится дело и без статистики и информатики: ведь здесь применяются методы стилометрии и факторный анализ. 

Почему выбраны корпуса именно на французском языке и именно XIII века? 

XIII век считается у историков веком глобальных изменений в сфере власти [1]. А Франция была одной из ключевых держав Европы в тот период. На тот период приходится большое количество грамот людей, обладавших властью. Большую роль в этом сыграла так называемая «документальная революция», благодаря которой мы имеем так много исторических источников той эпохи. Это позволяет не только провести лексикометрический анализ, но и учесть в нем отдельные социальные позиции и группы. 

Грамоты разделены на два корпуса. Первый корпус содержит грамоты архиепископов, епископов и аббатов, написанные на латыни. Аббаты — это настоятели монастырей. Епископы и архиепископы не относятся к монашеской церковной степени. Епископы надзирают за епархией (собранием местных приходов), а архиепископ держит под наблюдением только те из них, которые имеют более высокий статус. Ключевое различие между епископами и архиепископами заключается в их обязанностях. Помимо управления приходами и рукоположения епископов или нижестоящих санов, епископы также занимаются освящением и преподаванием религии. На архиепископах также лежит экуменическая и административная работа. Всего в корпусе текстов церковной аристократии содержится более 717 тысяч токенов* (т.е. условно около 717 тыс. слов). 

Второй корпус содержит 467 тысяч токенов и представляет собой собрание грамот верхушки светской аристократии, к которой относятся короли, герцоги и графы. Подобное разделение корпусов необходимо, поскольку власть светских лиц и власть прелатов отличается основами, функциями и полномочиями [1]. Следовательно, ожидается, что понятия власти у двух групп и их  семантические поля будут неодинаковые. 

Как устроена структура семантического поля власти?

Для начала необходимо получить расширенный список «слов власти». Его можно составить при помощи латинских словарей. В список входят слова, которые имеют «власть», «авторитет» или «доминирование» как одно из значений. Основная идея состоит в том, что таким образом возможно восстановить смысловые пересечения, которые характерны для исследуемых семантических полей. 

После того как будет известна частотность слов, информация о совместной встречаемости преобразовывается в матрицу совместной встречаемости слов, состоящей из нулей и единиц. Ноль говорит об отсутствии совместной встречаемости в рамках определенного отрезка текста, а 1 – о наличии. При этом совершенно неважно, каким числом до этого обозначалась встречаемость, важен сам факт его наличия. Лемматизация (т.е. приведение слов к начальной форме) произведена с использованием TreeTagger. 

Фрагмент таблицы «ключевые слова-совстречаемости»

Далее применяется факторный анализ, который позволяет свести множество лексикометрических параметров текста к нескольким «гиперпараметрам» (факторам), которые позволяют увидеть большую картину: как именно группируется лексика и какие слова образуют группы на основе совместной встречаемости. А далее можно анализировать, по каким семантическим признакам они группируются. Для оценки достоверности картинки ниже, где представлено распределение по двум первым гиперпарметрам, следует сказать, что факторный анализ первого корпуса показал, что первый фактор дает объяснение 12,89% дисперсии*, а второй – 11,64%. 

Факторный анализ первого корпуса 

Общая встречаемость первой оси (справа налево) из группы dominium/jurisdictio (властвование, владение/юрисдикция) связана с идеей власти как обладанием имуществом, а из группы judicium/auctoritas (суд, осуждение / власть, авторитет) относится с отправлением власти через судейские функции. 

Помимо этого, говорится о силах, при помощи которых властью отдаются приказы и принимаются решения. Вторая ось (сверху вниз) содержит последовательность действий, которая относится к письменному отправлению власти. 

Факторный анализ второго корпуса дал следующие результаты: первый фактор объясняет 15,26% дисперсии, а второй – 14,31%. Как можно заметить, результаты по сравнению с предыдущими несколько выросли. 

Факторный анализ второго корпуса

На оси слева направо можно увидеть оппозицию между группой dominium/jurisdictio/imperium и группой auctoritas/robur. Совстречаемости этих лемм показывают, что первая группа лемм используется светским составом власти для организации отношений доминирования. Это касается применения прав на землю и ее обитателей. 

Такой же тип власти встречается и в корпусе грамот прелатов. Обнаружен также и класс лемм, который связан с идеей главенствующего положения при помощи письменных документов. Чаще всего он встречается с фигурой короля. 

Вторая ось (сверху вниз) содержит третью группу — judicium/vis, чье первое понятие относится к судебной власти, а последнее имеет отношение к физической силе, которая используется незаконно. Получается, можно выделить несколько типов власти, по три типа для каждого из корпусов. 

Как бы то ни было, нельзя в полной мере говорить об аналогичных результатах хотя бы потому, что частотности лемм и состав слов, определяющих власть, меняются от корпуса к корпусу.  

Определение слов поля власти духовенства

Отдельно стоит обратить внимание на то, что леммы можно разделить на три группы по две леммы в каждой: auctoritas-robur, judicium-ordinatio, potestas-jurisdictio и voluntas-manus. Первая группа относится к власти, которая реализуется через письменные документы, вторая — к судебной области. Третья группа относится к теме сближения в значении «юрисдикция». 

В последней группе voluntas означает силу, с помощью которой производятся действия власти. В основном это происходит посредством передачи части своих прав на владения более авторитетной части. Как можно заметить, леммы внутри данных групп тесно связаны по семантике. 

Первый фактор объясняет 28,44% дисперсии, второй фактор — 21,99%, а последний — 20,62%. 

Факторы один и два 
Факторы один и три
Факторы два и три

На первой оси первого графика (слева направо) находятся две ключевые группы: jurisdictio и voluntas. Можно говорить об оппозиции власти в плане доминирования, которая основана на имуществе (как обмене, так и даровании), и в плане «возможности принимать решения» [1]. 

Вторая ось (первого и второго графиков) содержит следующие две смысловые группы: dominium/manus (то, куда передаются права) и voluntas/auctoritas (сила для передачи прав на земли и их обитателей или прочее имущество и сила для действия-подтверждения и приказа). 

Третья ось связана с противопоставлением jurisdictio и potestas, которые вместе обозначают «место передачи права». Таким образом, добавляется еще один тип власти, который может трактоваться как «силы, позволяющие действовать».

Определение слов поля власти светской аристократии

Для второго корпуса было выяснено, что первый фактор объясняет 31,56% дисперсии, второй — 19,93%, а третий — 17,85%. 

Факторы один и два 
Факторы один и три
Факторы два и три

Первая ось (слева направо первого и второго графиков) включает оппозицию групп jurisdictio/imperium и voluntas/manus. Возможна интерпретация как «имеющихся прав», так и силы передачи прав в случаях, когда имеются в виду добровольные действия авторитетов. 

Вторая ось содержит оппозицию леммы auctoritas и группы jurisdictio/voluntas/manus. В данном контексте лемма auctoritas рассматривается как сила принятия решений, сила постановления и сила одобрения. Вторая группа встречается в грамотах, где говорится о дарениях, продажах и владениях. 

На третьей оси на втором и третьем графиках есть оппозиция лемм imperium и potestas. Она отсылает к противопоставлению того, чем владеют и что осуществляют, и того, куда передается объект. 

Таким образом, благодаря факторному анализу определяются основные контексты, в которых слова семантического поля власти могут принимать участие. В данном эксперименте удалось определить слова, которые являются словами поля власти. 

Что будет, если весь словарь рассмотреть как словарь власти? 

Разделив корпусы из первого эксперимента на две группы, получилось соответственно четыре корпуса. Поскольку грамоты архиепископов из корпуса «прелатов» и грамоты герцогов из корпуса светских лиц составляют незначительный объем, они не берутся в расчет. 

В итоге в корпусе грамот аббатов содержится почти 312 тысяч токенов, в корпусе грамот епископов — 341 тысяча токенов, в корпусе грамот графов — 265 тысяч токенов, а в корпусе грамот королей — 177 тысяч токенов. 

При помощи программы TXM создана общая лексическая таблица, строки которой упорядочены по частотности слов.

Фрагмент таблицы «4 корпуса-леммы» 

Пусть порог для четырех корпусов будет составлять более чем 500 вхождений. Визуализированные результаты анализа в R выглядят так: 

Визуализация результатов анализа в R 

Из графика видно, что словарь прелатов находится ближе друг к другу, нежели словарь представителей светской аристократии. 

Для прелатов доминирование построено на том, что без невозможно попасть в Царство небесное. Интересно и то, что прелаты довольно часто использовали лексику, которая связана с созданием письменных документов. По мнению создателя структурной антропологии Клода Леви-Стросса, именно благодаря письменной коммуникации возможно представлять и укреплять свою власть [1].

Неожиданный результат получился по отношению к французским королям: довольно часто использовалась лемма auctoritas. Кроме того, именно для королей больше характерно употребление слова fideles, то есть тех, над кем осуществлялась власть. Это относится к тому, что в основе властных отношений лежала вера. График также показывает тесные контакты королей с группой архиепископов. 

Для графов же более показателен словарь передачи прав на имущество. Они осуществляли акт дарения, ручались за наследников и подавали милостыню. Стоит отметить, что графы в плане группы не были на одном уровне с королями и епископами. 

Словарь 2.0: глаголы-леммы проясняют взаимоотношения «светской» «духовной» аристократии

Следующая часть эксперимента состоит в сравнении самых частотных глаголов-лемм всеми исследуемыми группами власти. В качестве порога выступает число 150. В итоге получается два графика, которые представлены ниже. Первый фактор объясняет 48,19% дисперсии, второй — 26,51%, третий — 25,29%. 

Факторы один и два 
Факторы один и три 

В отличие от предыдущих графиков здесь более явно просматривается противопоставление слов, характерных для «светской» и «церковной» аристократии. 

Для епископов типичны такие действия, как рукоположение и выборы прелатов, совершение богослужений, установление или учреждение официальных просьб, признание; принятие решений, приказов; уступки, перемещение, получение благ и их владение, возвращение или отдача и распределение. 

Аббаты принимают участие в таких актах, как отпущение, освобождение, достижение соглашений, возвращение, удовлетворение петиций, требований (часто в результате судебных споров); удержание, передача чего-либо, деление и предложение. 

Короли часто приказывают, контролируют за своим движением или перемещением подвластных лиц, контролируют сбор средств, штрафов, отвечают, отказывают, а также берут под протекцию. И короли, и епископы являются главными в системе средневекового общества. 

Нередки случаи, когда графы совершают дарения и дарования, освобождения, распоряжения правами на имущество, становления или обретения, просьбы, клятвы. Из данного списка можно сделать вывод о том, что для графов больше всего характерна власть над людьми и землями. 

А если проанализировать только глаголы первого лица? 

Чтобы уточнить специфику действий, относящихся к власти, следует проверить глаголы, которые выражают действие от первого лица (как единственного, так и множественного числа, причем употребление последнего означало превосходство над другими [1]). Порог составил уже не 150 единиц, а 100 для всех 4 корпусов вместе. В результате график получился следующим: 

График дополнительной проверки для глаголов 

На оси слева направо видно противопоставление глаголов прелатов и королей с глаголами графов. К глаголам графов относятся не только те глаголы, которые использовались и остальными группами, но и глаголы дарения и обещания. 

Следующая ось показывает оппозицию между словарем королей и словарем «прелатов». График иллюстрирует факт, что для королей XIII века более типичны глаголы приказа. Короли вслед за графами передают часть своих благ в дарение и подтверждают данные действия. Прелаты, наоборот, получают имущественные блага через дарение. 

Соответственно, анализ групп глаголов признает истинным подмеченную историками особенность развития средневекового общества. Будучи доминирующей структурой, Церковь сосредотачивает имущественные блага. 

Я ничего не понял, что было-то? Что нового удалось узнать про «средневековую власть» благодаря лексикометрии?

Несмотря на то, что довольно непросто реконструировать семантические поля в средневековой латыни, лексикометрические эксперименты помогают прояснить картину. «Средневековую власть» все еще трудно определить, тем более в рамках современного понятия власти. Оно не может быть универсальным, и только через уровень репрезентации возможно перейти к другим средневековым понятиям. 

В целом можно выделить следующие типы власти: владение землями и людьми, возможность выносить судебные решения, возможность принимать решения и приказывать и другие. Обнаружена и группа лемм для сил, с помощью которых власть действует (auctoritas, voluntas), и группа лемм, которая отсылает к отношениям «во власти института или персоны X» (dominium, manus, potestas). Благодаря примененным выше методам получилось выделить специфичные властные действия для каждой из категорий аристократии. 

Кроме того, подтвердились изыскания историков касательно представления королей и епископов в качестве «полюсов-доминантов». Также подтвердилась идея, что Церковь концентрировала имущественные блага. 

Источники:

  1. Шелина Е. А. — «Средневековая власть» сквозь призму лексикометрии. Анализ словаря грамот французской аристократии XIII в. // Историческая информатика. — 2020. — №4. — С. 219-238. 

Глоссарий к материалу:

  • Лексикометрия – раздел лексикологии, которая исследует статистические отношения в словарном составе языка.
  • Факторный анализ – многомерная методика, которая позволяет изучить взаимосвязи между параметрами переменных.
  • Семантическое поле – совокупность слов, у которых имеется значительный общий компонент значения, то есть семантический признак.
  • Токен – последовательность символов в документе, которые соответствуют слову и имеют значение для анализа.
  • Лемматизация – приведение всех токенов к леммам*.
  • Лемма – преобразованный токен, который отличается от начальной формы слова тем, что в лемме не учитываются ударение и семантика, если два разных слова пишутся одинаково.
  • Дисперсия – статистическая величина, которая показывает, насколько сильно отличаются значения друг от друга и каким образом.