Читать нас в Telegram
Иллюстрация: Женя Родикова

Аллюзии в жизни филолога

Если открыть комментарий к случайному произведению случайного латинского автора или даже просто пролистать комментированный перевод, вы обнаружите много указаний на цитаты и аллюзии — то есть отсылки к предшествующей литературной традиции. Для филологов-классиков выявление таких отсылок — обязательный пункт при комментировании текста. 

Функция аллюзий может быть разная. Иногда это попытка автора продемонстрировать свою ученость, иногда — вежливый кивок в сторону основоположников жанра, иногда — инструмент для передачи дополнительных оттенков смысла [1]. И иногда — всё вместе. 

В XX веке структуралисты и постструктуралисты назвали все это словом «интертекст»: параллели между разными произведениями составляют своеобразную систему литературы, в рамках которой все обретает смысл. Мы не читаем тексты изолированно, а воспринимаем их через призму всего, что было прочитано нами раньше.

Сложности выявления аллюзий

Чтобы исследовать интертекстуальность в римской литературе, нужно сначала такие отсылки каким-то образом обнаружить. И вот здесь начинаются проблемы. Все эти произведения писались совсем не для нас, а для аудитории, которая была отлично знакома с традицией и держала в голове сразу много других — более древних — текстов, причем на своем родном языке. Это значит, что для авторов обычно не было нужды специально предупреждать читателя о том, что сейчас последует цитата.

В поэзии это сделать совсем проблематично. Свои ограничения накладывает метрика и специфика текстов, где автор почти никогда не пишет от своего лица, но даже в прозе редко можно найти специальные слова-маркеры, вводящие цитату. С аллюзиями же такие предупреждения вообще не предусмотрены, ведь смысл заключается именно в том, чтобы читатель сам заметил скрытую отсылку (и порадовался своей образованности).

Несмотря на эти сложности, выявление цитат и аллюзий остается для филологов-классиков важной задачей, справляться с которой до недавнего времени приходилось традиционными методами. Никто не спорит с тем, что держать в голове большой объем текстов и регулярно перечитывать самые разные произведения латинских авторов полезно и важно. Но все же держать в голове весь латинский корпус невозможно, и это накладывает некоторые искусственные ограничения на процесс поиска параллелей между текстами. Например, с большей вероятностью он будет осуществляться в рамках одного жанра. Отдельный человек может быть специалистом, например, по элегиям и будет искать отсылки к другим элегиям. Это обычный рабочий процесс для комментаторов, а между тем нет уверенности, что авторы ставили себя в такие рамки и отсылали только к элегиям.

Можно попытаться обойти подобные ограничения цифровыми методами. Имея в своем распоряжении информацию обо всех отсылках и параллелях, которые есть в произведении, мы могли бы, например, установить круг чтения конкретного автора, исследовать влияние жанров друг на друга и разные стратегии цитирования. Наконец, удалось бы выяснить, какие места и в каких текстах были самыми популярными источниками для аллюзий. 

Система выделения аллюзий Tesserae: принципы работы

Одним из самых доступных цифровых инструментов в этой области на данный момент является Tesserae — проект университета Баффало, бесплатное веб-приложение, которое работает с корпусом текстов из баз Perseus Digital Library и The Latin Library

В основе работы этого приложения лежит достаточно простая идея. Пользователь выбирает два произведения из корпуса, после чего программа сравнивает их и возвращает список всех предложений, которые содержат хотя бы два совпадающих слова. Собственно, таким же принципом на первом этапе руководствуются и комментаторы — ищут места с похожей лексикой [2].

Рис. 1. Интерфейс веб-приложения

Однако этого мало. Интуитивно понятно, что существуют частотные слова, например, союзы или местоимения, которые у любого автора могут стоять в предложении рядом, и это не будет ни цитатой, ни аллюзией. Для того, чтобы место можно было рассматривать как отсылку к другому тексту, желательно, чтобы лексика была редкой. Уже в конце 90-х, когда цифровые методы только начали применяться в этой области, классики заметили, что параллели, найденные при помощи компьютера, часто почти насильно пытаются выдать за что-то стоящее, даже если речь идет о самых обычных словах, стоящих рядом [1].

Эту проблему Tesserae решает на двух уровнях.

Во-первых, чтобы избавиться от самого очевидного шума, при поиске предусмотрен стоп-лист: пользователь сам может настроить его размер (до двухсот слов) и выбрать, включить ли в него самые частотные слова во всем корпусе или только в тех текстах, с которыми ведется работа.

Во-вторых, авторы проекта придумали специальную систему ранжирования, чтобы формализовать те критерии, которыми при работе всегда руководствовались комментаторы. Все предложения, в которых программа нашла совпадающие слова, получают оценку от 2 до 10, которая учитывает два параметра — частотность употребления этих слов и расстояние между ними во фразе. Сравнительно редкие слова, стоящие рядом, с большей вероятностью будут составлять осознанную отсылку или цитату и, соответственно, получат по такой системе более высокую оценку [3].

Рис. 2. Параметры стоп-листа (сверху) и формула, по которой рассчитывается оценка для каждого найденного лексического совпадения (снизу) [3]

В процессе тестирования авторы проекта сравнивали результаты выдачи приложения с тем, что уже было известно по комментариям, а также вручную проверяли контексты для предполагаемых аллюзий. Оказалось, что система ранжирования действительно неплохо работает. Места, которые получают оценку 7–10, с большой долей вероятности представляют собой интерпретируемые текстовые параллели, на которые по крайней мере стоит обратить внимание [3].

Тут, однако, нужно сделать акцент на том, что работа филолога все еще важна даже при наличии такого инструмента, поскольку каждый результат по-прежнему нужно рассматривать отдельно и пытаться объяснить в зависимости от контекста. Tesserae этого пока не умеет — только выполняет умный поиск по корпусу на предмет лексических совпадений.

Наконец, стоит упомянуть, что искать совпадения можно не только по точной форме, но и по лемме, похожему звучанию и даже по семантической близости. Последняя опция представляет наибольший интерес: с ее помощью пользователь может найти отрывки, в которых слова различаются, но имеют схожие значения. Например, при сравнении стихотворений Катулла с «Георгиками» Вергилия в качестве совпадений были найдены tacet nox (Catullus 7.7) и silet nox (Georgics 1.247). И то, и другое можно перевести как «ночь молчит», при этом используются два разных глагола — tacet и silet. Искать такие семантические совпадения можно не только в паре латинских текстов, но даже между латинскими и греческими произведениями [5].

Рис. 3. Другие параметры для расширенного поиска: опция Feature позволяет выбрать, осуществлять ли поиск совпадений по точной форме, лемме, значению или звучанию слов

Применение в исследованиях

Новая аллюзия Лукана к Энеиде

Самый простой результат работы с Tesserae — это выявление новых текстовых параллелей, которые до этого не были отмечены комментаторами. Например, в ходе тестирования третьей версии приложения команда проекта обнаружила потенциальную аллюзию к «Энеиде» в первой книге «Фарсалии» Лукана. По системе ранжирования совпадение получило оценку 7, так что исследователи проверили особенности метрики, а также контексты для соответствующих строчек.

Рис. 4. Схожие фрагменты из «Фарсалии» и «Энеиды», найденные при помощи Tesserae [3]

Во фрагменте 1.303–5 Лукан повествует о массовом бегстве из Рима при появлении Цезаря, сравнивая паническую реакцию римлян со страхом перед Ганнибалом несколькими поколениями ранее. Этот отрывок имеет сходство с эпизодом 6.857–9 «Энеиды». В загробном мире Анхиз рассказывает Энею о том, каким великим людям суждено родиться в Риме, указывая в том числе на будущего полководца Марцелла, который спас город от карфагенян в Первой Пунической войне. 

Несколько особенностей заставляют провести параллель между двумя отрывками: объединение в одной строке слов «Рим» и «потрясение» (tumultu), перенос глагола с первой строки в начало второй и размещение формы слова «карфагенянин» в той же метрической позиции перед цезурой. Такое сходство, вероятно, должно было заставить читателя «Фарсалии» вспомнить о рассказе Анхиза. Лукан представляет римлян не только бегущими от Цезаря, как они могли бы сделать это в случае с Ганнибалом, но и бегущими, как не сделал Марцелл, столкнувшись с более ранней карфагенской угрозой во время Первой Пунической войны. Эта параллель усиливает критику Лукана в адрес римлян за то, что они покинули свой город [3].

Стратегии цитирования

Рассматривать отдельные моменты может быть весьма интересно, но функционал Tesserae позволяет также смотреть на все текстовые параллели в совокупности. Результаты выдачи можно сохранить в формате .csv и на их основе делать визуализации (например, при помощи Pandas или других похожих библиотек).

Например, команда проекта задалась вопросом о том, на какие книги «Энеиды» Лукан опирается чаще всего в качестве источника для аллюзий. Как видно на диаграмме, книги 2, 4, 11 и 3 используются чаще всего для создания сложных параллелей (в своей статье они называют их параллелями четвертого и пятого типа, что соответствует оценкам 7–10 по системе ранжирования), в которых важную роль играет контекст [2].

Рис. 5. Источники сложных параллелей в разных книгах «Энеиды»

Также можно визуализировать распределение отсылок в самом тексте «Фарсалии». Здесь исследователи тоже получили достаточно интересный результат. Оказалось, что в первой книге сложные аллюзии больше всего сконцентрированы во вступлении и в первых описаниях Цезаря и Помпея [2].

Рис 6. Распределение аллюзий в первой книге «Фарсалии»

Работа с разными жанрами

Наконец, Tesserae дает исследователям возможность без больших затрат по времени проверять гипотезы об интертекстуальных связях между произведениями разных жанров. Сравнение «Фарсалии» с «Энеидой» было очень продуктивно на этапе тестирования приложения, поскольку о влиянии Вергилия на Лукана было известно заранее. Однако теперь, когда система ранжирования достаточно хорошо настроена, можно попытаться выяснить, на каких еще авторов он мог ориентироваться.

Так, исследователь Патрик Бёрнс задался вопросом о том, часто ли текст «Фарсалии» отсылает читателя к любовным элегиям Тибулла, Проперция и Овидия. Ему удалось выяснить, что влияние этих авторов на Лукана сопоставимо с влиянием Вергилия, даже несмотря на то, что их произведения по объему гораздо меньше «Энеиды». Самая большая концентрация параллелей обнаружилась в тех эпизодах «Фарсалии», где Помпей встречается с Корнелией (5.722–815), а Цезарь — с Клеопатрой (10.53–106) [4].

Рис. 7. Параллели «Фарсалии» с любовными элегиями

Вопреки опасениям классиков, цифровые методы оказываются очень полезны для исследования интертекстуальности в латинской литературе. Конечно, проект Tesserae — это не единственный инструмент, позволяющий выявлять текстовые параллели. Но он особенно хорош тем, что начать работу с ним очень легко благодаря простому интерфейсу и готовому корпусу, а специально разработанная система ранжирования лексических совпадений позволяет делать выводы о паттернах цитирования у разных авторов.

Источники

  1. Fowler D. On the shoulders of giants: intertextuality and classical studies // Materiali e discussioni per l’analisi dei testi classici. — 1997. — С. 13–34.
  2. Coffee N. et al. The Tesserae Project: intertextual analysis of Latin poetry // Literary and linguistic computing. — 2012. — Т. 28. — №. 2. — С. 221–228.
  3. Forstall C. et al. Modeling the scholars: Detecting intertextuality through enhanced word-level n-gram matching // Digital Scholarship in the Humanities. — 2015. — Т. 30. — №. 4. — С. 503–515.
  4. Burns P. J. Measuring and Mapping Intergeneric Allusion in Latin Poetry using Tesserae // Journal of Data Mining & Digital Humanities. — 2017. — №. Towards a Digital Ecosystem: NLP. Corpus infrastructure. Methods for Retrieving Texts and Computing Text Similarities.
  5. Coffee N. An agenda for the study of intertextuality // TAPA. — 2018. — Т. 148. — №. 1. — С. 205–223.