Читать нас в Telegram

Для того чтобы интерпретировать любой текст, необходимо установить его оригинальную формулировку. К текстологии Нового Завета ученые сравнили различные рукописные варианты по несовпадениям отдельных слов, вычисляя расстояние Левенштейна. Этот метод позволяет установить, что комбинация одних букв перепутана с комбинацией других, и выяснить, какая из формулировок скорее всего была первоначальной.

Впоследствии результаты переводятся в евклидово пространство с использованием классического многомерного масштабирования, которое обеспечивает нужное представление данных для пространственного анализа. Так расстояния между текстами оказываются вычислимы в буквальном (географическом) смысле. В этом исследовании авторы даже применили геоинформационную систему для визуализации результатов.

Ошибки писцов при переписывании рукописей

Первые основные части Новозаветных текстов датируются третьим и четвертым веками нашей эры. Хотя тексты передавались из поколения в поколение с большой осторожностью, между разными рукописями неизбежно появляются различия.

Можно предположить, что ошибки при переводе текстов возникали во время чтения (или слушания), запоминания и написания содержимого оригинальной рукописи. Кроме того, они могли быть допущены из-за плохого зрения, путаницы в письмах, небрежного почерка, неправильного толкования и сокращений. Так возникали варианты текстов с различиями в пунктуации и орфографии, измененными словами и даже с пропущенными абзацами. А еще переписчики иногда намеренно изменяли содержание одного и того же текста по своим догматическим убеждениям.

Чем занимается текстология

Текстология как наука разрабатывает методы для систематической оценки древних текстов. Помимо выявленных различий, существуют тексты, рукописные варианты которых схожи, однако содержание озадачивает исследователей. В этом случае некоторые ученые строят предположения об искажении текста и вносят в него поправки. Учитывая существование разных текстовых вариантов и отсутствие комментариев, целью текстологии является восстановление оригинального текста из имеющихся рукописей.

Традиционно текстология занималась изучением существующих текстовых вариантов Нового Завета, которые известны из рукописей, словарей и лекций; однако сейчас она расширила сферу деятельности, чтобы получить представление об истории передачи текстов и, следовательно, об убеждениях и руководящих принципах переписывающих сообществ.

Как выбрать правильный вариант?

Иногда выбрать корректный текст между существующими вариантами не так просто. Ученые сталкиваются с такими трудностями, как логические противоречия и несоответствия в тексте, и поэтому не берутся утверждать, что среди существующих вариантов сохранился оригинальный. В таком случае единственный оставшийся выход — предположить, каким должно было быть первоначальное прочтение. Эти так называемые гипотетические поправки (умозрительные изменения текстов, для которых не существует никаких рукописных доказательств) также становятся объектом интереса для текстологии.

Откуда брать данные?

Важным инструментом критического изучения гипотез является Амстердамская база данных гипотетической поправки к Новому Завету (ADNTCE). Эта база содержит приблизительно 6500 предположений о правках для текстов Нового Завета, собранных из комментариев богословской литературы. Сюда также включены данные по обсуждению конкретных гипотез.

Данные о поправках представлены в табличной форме

В базе зафиксирован только сам факт поправки, но нет информации о ее происхождении. Появилась ли поправка из-за опечатки или кто-то внес изменения в текст из-за своих убеждений? Исследователи решили оценить каждую поправку количественно.

Сопоставление строк и вычисление расстояний

Исследователи предложили метод оценки вероятности палеографической [1] (т.е. исторической) путаницы для объяснения происхождения предположительных поправок. Метод состоит в том, что исследователи сравнивают варианты путаницы, используя метрику, которая основана на расстоянии Левенштейна.

Расстояние Левенштейна (редакционное расстояние, дистанция редактирования) — метрика, измеряющая различие между двумя последовательностями символов. Расстояние определяется как минимальное количество односимвольных операций (замена, вставка и удаление символа), нужное для того, чтобы из одной последовательности получить другую.

Наиболее часто используемые операции сопоставления строк — вставка (insertion), удаление (deletion), замена (substitution) и перестановка (transposition). На замену и перестановку действует ограничение (constraint) — буквы неодинаковые

Исследователи усовершенствовали исходный алгоритм Левенштейна в двух направлениях. Во-первых, учитывалась вероятность спутать буквы, похожие друг на друга внешне. Оценка вероятности основана на опыте текстологии при работе с рукописями. Исследователи пользовались готовой таблицей, фрагмент которой мы приводим ниже:

Примеры вероятности (в процентах), с которой могут быть спутаны определенные буквы

«s» (substitution/замена) в последней колонке значит, что автор варианта Нового завета перепутал две похожие буквы и заменил одну другой. При подсчете расстояния стоимость такой операции учитывалась как 1/p, где p — значение вероятности из таблицы.

Во-вторых, усовершенствованный алгоритм учитывает три дополнительные операции: «сжатие» (contraction), «разрыв» (explosion) и сложная замена (complex substitution).

Дополнительные операции: сложная замена (complex substitution) — замена сразу двух букв на две другие, «сжатие» (contraction) — объединение двух букв в одну (третью) и «разрыв» — одна буква как бы разрывается и из нее получаются две новые

Полученная метрика показывает близость в орфографии альтернативных чтений. То есть, если расстояние между одним вариантом чтения и предположительным оригиналом маленькое, то схожесть высокая. Чем больше вариант похож на оригинал, тем выше вероятность, что переписчик просто ошибся, а не внес в текст намеренную правку.

Чем питался Иоанн Креститель? Пример использования метода пространственного анализа

Исследователи применили свой метод, чтобы проанализировать разные варианты описания пищи Иоанна Крестителя. В качестве замены «саранчи» и «дикого меда» (ακριδεσ και μελι) в рационе Иоанна Крестителя были предложены несколько гипотетических вариантов: кокосы и дикий мед (καριδεσ και μελι), пирог и дикий мед (εγκριδεσκα μελι), креветки и дикий мед (γαριδεσ και μελι), дикие груши и дикий мед (αχραδεσ και μελι), зерно и дикий мед (ακρεμωνεσ και μελι), а также корень и фрукты (ριζασ καια).
Затем было вычислено расстояние Левенштейна от каждого варианта до каждого, результаты можно представить в виде таблицы:

Строки и столбцы таблицы соответствуют отдельным вариантам, на пересечении — расстояние между двумя конкретными вариантами (их степень различия)

Например, мы можем понять, какой вариант наиболее близок к ακριδεσ (саранча), это καριδεσ (кокосовые орехи); но здесь также возникает ряд предположений. Например, нужно ли проводить прямую связь между καριδεσ и ακριδεσ? Точно так же, можно предположить, что γαριδεσ (креветки) должны были быть оригиналом, который сначала был превращен в καριδεσ (кокосовые орехи), который в свою очередь обратился в ακριδεσ (саранчу). Другие варианты настолько не похожи на оригинал, что, скорее всего, здесь могли иметь место более серьезные ошибки писцов, чем описки.

При помощи многомерного масштабирования [2] мы можем отобразить взаимное расположение вариантов на плоскости. Визуализация поддерживает рассуждения, которые мы привели выше.

Звездочкой на рисунке отмечено оригинальное слово (саранча), точками — варианты

Можно одновременно визуализировать все расстояния для каждого варианта (т. е. одновременно визуализировать все строки или столбцы таблицы).

Для этого исследователи применили инструмент Natural Neighbor в ArcGIS 10.5, который раскрашивает плоскость на основе взвешенных расстояний от определенного варианта до всех остальных. В зеленую область попадают варианты, наиболее похожие на рассматриваемый, а в красную — совсем непохожие. Исследователи повторили это 7 раз по числу вариантов:

На рисунках можно наблюдать следующее:

Палеографическое смешение ριζασ και καρπον (корень и плод) с любым из других гипотетических вариантов маловероятно. Этот вариант всегда находится вдали от других (в левом верхнем углу плоскости) и попадает в зеленую область только с самим собой.

Аналогичный вывод можно сделать для ακρεμωνεσ (зерна, ниже всех на плоскости), но следует отметить, что вариант ριζασ και καρπον (корень и плод) все равно более удален от других. Судя по всему, эти варианты с наибольшей вероятностью не являются первоначальными, а появились из-за вольности конкретного писца.

Полученные данные необходимо интерпретировать с осторожностью (так как результаты многомерного масштабирования остаются приблизительными). Правдивость конкретной гипотезы доказать, принимая во внимание другие соображения и аргументы, такие как учет семантики, грамматики, фонетики и даже географии региона.

Источники

Примечания:

[1] Палеография вспомогательная историческая дисциплина (специальная историко-филологическая дисциплина), изучающая историю письма, закономерности развития его графических форм, а также памятники древней письменности в целях их прочтения, определения автора, времени и места создания.

[2] Многомерноемасштабирование (MM) метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым объектам, в пространстве меньшей размерности чем пространство признаков объектов. Целью ММ является обнаружение структуры в наборе значений некоторой меры расстояния между объектами.