Что такое элегия?
В «золотую» для русской поэзии пушкинскую эпоху среди всех стихотворных жанров, пожалуй, важнейшее место занимали элегии. Тематика их разнилась от рассказов об исторических событиях до интимных любовных признаний, однако центральной всегда оставалась одна особенность: рассказ об индивидуальном переживании, из которого складывается особое «элегическое» и часто меланхолическое («унылое») настроение. Так, герои элегий часто сетуют на несчастливую судьбу, несчастную любовь и рано ушедшую, «отцветшую» юность.
Хотя элегия как жанр зародилась еще в Древней Греции и имела к тому времени долгую и обширную историю, для русских поэтов начала XIX века наибольшее значение имели римские элегики (прежде всего — Катулл, Тибулл, Овидий), а также современные элегии английских (Т. Грея, поэтов озерной школы) и французских поэтов (Э. Парни, Ш. Мильвуа, А. Ламартина). Наиболее выдающимися образцами русской элегии признаны элегии В.А. Жуковского, К.Н. Батюшкова, Е.А. Баратынского и, безусловно, А.С. Пушкина.
О русской элегии написано немало филологических трудов, из которых стоит указать на важнейшее исследование В.Э. Вацуро и обзорную монографию Л.Г. Фризмана. Здесь, однако, замечу, что обычно ученые изучают элегии наиболее «значимых», канонических авторов. Для количественного исследования, однако, даже собранных вместе наиболее «выдающихся» элегических стихотворений явно не хватит: не только потому, что «каноничность» — спорный критерий отбора, но и просто потому, что будет недостаточно материалов для количественного/статистического анализа. Быстро приходящий на ум выход из такой ситуации — подготовить для исследования специальный корпус русских элегий.
Корпус русской элегии: критерии отбора и состав
Не секрет, что дошедшие до сегодняшнего читателя собрания сочинений, антологии и переиздания — лишь очень небольшая выборка из всей литературной продукции прошедших эпох. Большая же часть напечатанных в журналах начала 19 века стихотворений и повестей давно забыта и может быть названа «архивом» литературы. Из этого «архива» — непосредственно журналов, альманахов и сборников, изданных с 1815 по 1835 — и были собраны тексты, вошедшие в корпус элегий.
Конечно, собрать такую коллекцию — значит долго просматривать источники и перепечатывать оттуда тексты, что будет дольше и сложнее, чем, например, выгрузить уже готовые данные из твиттера. Поэтому исследования, связанные с историческими источниками (а, следовательно, и проблемами их оцифровки), намного более трудоемкие, но, с другой стороны, и более захватывающие: последние 200 лет мало кто обращался к исследуемым вами материалам, а в корпусе они вновь обретут значение и ценность.
Для исследования были выбраны только тексты, которые при публикации назывались «Элегиями». Такой строгий критерий отбора был нужен, чтобы избавиться от влияния современных представлений об элегии: в корпус попало то, что сами поэты или редакторы журналов назвали бы элегией, например, в 1820 году.
Сначала было выделено 509 таких элегий с ссылками на источники, датировками и данными об авторах (все это доступно на GitHub). Однако, поскольку интереснее всего узнать про «эволюцию» жанра — про то, что произошло с элегией за 20 лет ее развития (с 1815 по 1835), — для основного анализа были взяты только 390 элегий с более-менее точными датировками*. В сумме эти 390 стихотворений состоят из 87 тысяч словоформ или 7 тысяч лексем.
Унылые слова и их подсчет
Первое и самое простое, что можно сделать с таким жанрово-единообразным корпусом — посмотреть, какие слова его отличают от поэзии вообще.
Для этого можно сравнить наиболее частотные слова в элегиях и в поэтическом подкорпусе Национального корпуса русского языка, НКРЯ. Это сравнение показывает, что среди первых 40 частотных слов в обоих корпусах элегии отличают, например, такие слова как «милый», «небо», «слеза» и «мечта». Если смотреть на частотные сочетания из двух слов (биграммы), то для элегий характерны, например, такие: «последний раз», «милый друг», «вся радость», «юные годы», «слезы лить», «сладкий сон». «Мечтательная» и «меланхолическая» сторона элегических стихотворений прослеживается уже на этом этапе, но лексические частоты вряд ли смогут ответить на сколько-нибудь серьезные исследовательские вопросы.
Известно, что к середине 1830-х годов элегии совсем потеряли популярность и писать их почти совсем перестали. Смогут ли количественные инструменты помочь увидеть, что именно произошло со стихотворениями к этому времени?
Статистика о длине стихотворений
Хотя в поэтических текстах меньше слов, чем в прозе, в них есть другие признаки, которые можно подсчитать или измерить: этим занимается стиховедение, которое изучает стихотворные размеры и метры, рифмы и другие важные формальные характеристики стиха. Однако есть и более простые уровни, например, длина стихотворения в строках. Так, можно предполагать, что элегии, написанные в 1810-х годах, будут более пространными, чем «короткие» элегии 1830-х годов.
Эту гипотезу можно легко проверить, используя данные собранного корпуса элегий.
Подсчитав количество строк в каждой из элегий, можно суммировать данные за каждый год и вычислить среднюю и медианную длины элегии (Рис. 1).
Среднее значение — это сумма всех значений, разделенная на их количество. Медианное же значение это такое, которое делит все значения на две равные группы: половина значений в выборке будет меньше, чем медианное, а другая половина — больше.
Средние и медианные значения длины за каждый год можно расположить на графике, где на горизонтальной оси будут годы, в которые элегии были напечатаны. Теперь с помощью модели — линейной регрессии (прямая линия на Рис.1) — можно проверить, действительно ли уменьшение длины элегии статистически значимо. Как видно из рисунка, и средняя, и медианная длины в строках становятся меньше к 1835 году. Описывающие линейную модель данные подтверждают отрицательную корреляцию между годом и длинной: это значит, что чем позднее была напечатана элегия в нашем датасете, тем она короче**. Так, замеченная при чтении особенность элегий разного времени подтвердилась статистическим тестом.
Topic modelling о любви
Сокращение стихотворений в объеме — всего лишь одна из черт, указывающих на изменения внутри поэтического жанра. Другая формальная особенность «эволюции» элегий заключается в том, что сначала их писали разными стихотворными размерами, а затем начал преобладать только один — четырехстопный ямб (его засилье характерно для всей поэзии этого времени вообще, неслучайно он стал размером «Евгения Онегина»).
Важнее всего, конечно, то, что происходит с содержанием элегий: уровнем, который едва ли легко поддастся подсчетам. На сегодняшний день, однако, уже существуют методы, позволяющие хотя бы на уровне языка (лексики) проследить поведение отдельных тем: это тематическое моделирование (topic modelling).
Метод тематического моделирования позволяет проанализировать распределение слов в текстах в корпусе: за основу берется количество появлений отдельного слова*** в каждом стихотворении (например, для элегии Пушкина «Поедем, я готов…»: «поехать»:2, «я»:4, «готовый«:3 и т.д.), составляется большая таблица со всеми словами в корпусе и их количеством в каждом стихотворении (если слова нет в стихотворении, ставится, соответственно, 0).
Далее алгоритм анализирует, какие слова встречаются друг с другом в каждом тексте, и на основании общего распределения в корпусе вычленяет в текстах темы (topics). Тема в этом случае — это набор из наиболее вероятных слов, которые и позволяют интерпретировать тему как некоторую смысловую единицу, понятную человеку. Кроме того, алгоритм считает каждый текст «сгенерированным» из всех без исключения тем модели, позволяя оценить вероятности тем в любом тексте, а также показывает, в каких стихотворениях определенная тема представлена с наибольшей вероятностью.
Для корпуса элегий была построена такая тематическая модель из 12 тем (содержательная интерпретация некоторых из них есть далее по тексту), долю которых в корпусе можно изобразить на временной оси:
Заметно, что в текстах конца 1810-х — начала 1820-х годов больше, чем в другие периоды встречаются темы 11 (желтым цветом) и 10 (фиолетовым).
В число 15 наиболее вероятных слов**** в теме 11 входят такие: «слава», «страна», «меч», «родина», «сын», «герой», «враг» и «бой». Исходя из филологической классификации элегий, можно сказать, что эти ключевые слова указывают на поджанр «исторической» элегии, рассказывающей о героических сражениях, великих предках и их зачастую трагической судьбе. Например, модель указывает, что эта тема особенно вероятна в элегии Батюшкова «На развалинах замка в Швеции» (сравните: «А ты, мой сын, клянись мечом своих отцов / И Гелы клятвою кровавой / На западных струях быть ужасом врагов / Иль пасть, как предки пали, с славой!»).
Наиболее вероятные слова для темы 10 — «бог», «сердце», «певец», «лира», «слава» и «муза», — отсылают к популярной даже в школьных сочинениях теме «поэта и поэзии». Как видно из распределения, в элегиях тема поэта и поэзии, наряду с исторической, была значима в конце 1810-х годов. Можно предполагать, что присутствие этих тем в элегии конца 1810-х годов является отголоском традиции «военной» (одической) поэзии, связанной с войной 1812 года. Это влияние, впрочем, быстро исчезает, и к началу 1820-х годов в элегиях начинают преобладать другие темы.
Начиная с середины 1820-х годов все большую долю в корпусе занимает «любовная» тема (№ 5, розовым цветом). Характеризующие ее слова такие: «я», «ты», «любовь», «душа», «друг», «она», «любить», а также прилагательное «милый». По данным модели, эта тема присутствует, например, в любовных элегиях Баратынского («Разуверение») и Пушкина («Простишь ли мне ревнивые мечты»). Наиболее распространенные вариации сюжета в этой теме — рассказ о несчастной любви, расставании и смертельной печали, охватившей героя стихотворения, — сделали элегию частым объектом для пародий и иронических подражаний.
Исходя из данных корпуса элегий, можно сказать, что к концу 1820-х годов «Элегией», как правило, стали называться любовные стихотворения. Наблюдения же над формальными уровнями длины и используемых размеров говорят о том, что в это же время элегии стали короткими стихотворениями, преимущественно написанными одним размером — четырехстопным ямбом. Так уменьшение тематического и формального разнообразия внутри жанра привело, по-видимому, к окончательному его «вымиранию»: короткие любовные признания быстро вышли из моды, и уже к началу 1830-х годов поэты стремились выйти за рамки специфических элегических тем и языка. Между тем, именно элегии легли в основу развивающегося поэтического языка: короткие медитативные стихотворения впоследствии стали основой русской лирики. И если сегодня вас попросить написать «серьезные» стихи, то с большой вероятностью вы напишете что-то подобное любовной элегии 1820-х годов.
* Это 390 стихотворений из периодических изданий (журналов и альманахов), где авторы публиковали отдельные свои (как правило) новые тексты, в то время как в сборники, разумеется, могли входить стихотворения совсем разного времени.
** Несколько выходя за рамки темы, нужно сказать, что в это время стихотворения вообще становились короче: это, по-видимому, связано с тем, что поэты 1820-х — 1830-х годов начали отказываться строго соблюдать «правила» поэтических жанров. Поэтому то, что видно из наблюдений над корпусом элегий, может быть не столько уникальными, сколько очень показательными процессами для поэзии этого времени, когда элегия имела большое значение и влияние на другие жанры.
*** Перед подсчетами все слова в корпусе были приведены к начальным формам — леммам (например, для существительных: именительный падеж, единственное число).
**** На графике показаны только первые пять наиболее вероятных слов и, как правило, это местоимения, не так много сообщающие о содержании темы. Часто при построении тематических моделей исключаются все «не смысловые» слова (местоимения, союзы, предлоги, частицы), однако в этом случае, как кажется, местоимения все же имеют значение: из распределения слов в темах видно, что одна часть тем связана с описаниями внутреннего состояния героя (в них преобладает «я»), а другая — с описанием адресата элегии (обращение к «ты»).