Существует ли связь между стихотворным размером и тематикой стихотворения? Можно ли стихи, написанные одним размером, объединить в связанные по смыслу группы? Ищем ответы на эти вопросы в европейской поэзии с помощью тематического моделирования
Иллюстратор: Алёна Овчинникова
Работа Артёма Шели, Петра Плехача и Али Лаше «Семантика европейской поэзии формируется консервативными силами: Соотношение стихотворного размера и значения в силлабо-тоническом стихе» — это первое масштабное количественное исследование, доказывающее устойчивую связь между поэтическим метром и семантикой стихотворения в Европейской литературе XVIII-XX веков. Авторы, обращаясь к последним исследованиям в области Digital Humanities, утверждают, что изменение особенностей художественных произведений происходит постепенно и за продолжительные периоды времени. Исследователи задают вопрос о роли преемственности и степени консервативности в культурных традициях, связанных с творческой свободой.
В этом исследовании учёные компьютерными методами проверяют существование семантического ореола метра (semantic halo of meter). Семантический ореол стихотворного метра — это те смысловые традиции, которые повторяются и обновляются поэтами последующих поколений в произведениях, написанных одним размером, то есть семантический ореол показывает связь между формой стихотворения и смыслом. Другими словами, в разных стихотворениях разных авторов мы можем обнаружить схожую тематику, если они написаны одним и тем же размером. Впервые этот термин появился в работах (1979 г.) М.Л. Гаспарова, филолога, историка античной литературы и русской поэзии.
Исследователи собрали корпус из 150 000 стихотворений на чешском, немецком, русском языках (важно, что традиции стихосложения на этих языках очень близки), текстов английской поэзии и голландских песен Раннего Нового времени. При помощи тематического моделирования они выделили ключевые темы стихотворений и провели наблюдение — будут ли у текстов с общей тематикой совпадать формальные характеристики.
Авторы исследования проверяют три гипотезы:
Чтобы доказать, что у разных стихотворений, написанных одним размером, общая тематика, исследователи отобрали достаточно распространённые стихотворные размеры, например: от трёхстопного до шестистопного ямба и от трёхстопного до шестистопного хорея (количество стихотворений, написанных в каждом размере более 500), а затем поделили их на случайные выборки по 100 стихотворений на размер и объединили вероятности тем в каждой выборке. При используемом тематическом моделировании каждое стихотворение в корпусе может быть представлено в виде набора вероятностей всех тем, которые могут быть затронуты в этом стихотворении. Затем использовали метод k-means (k-средних), чтобы поделить выборки на k группы, где k задается как количество различных метров. Полученные кластеры сравнили с выборками стихотворений, где тематические группы уже распределены по стихотворным размерам. Процедуру повторили 10 000 раз с корпусом текстов для каждого языка. Все результаты показали высокий уровень связи между метрическими формами и семантическими особенностями соответствующих стихотворений в каждом из исследуемых корпусов, т.е. наглядно продемонстрировали связь между метром (формой) и смыслом.
Чтобы это проверить, каждый корпус был поделён на два подкорпуса в зависимости от даты публикации конкретных стихотворений. В каждом подкорпусе исследователи проверили силу связи между метрической маркировкой (включает в себя стихотворный размер) и объединёнными семантическими признаками по всей выборке способом, который использовался и при проверке первой гипотезы. Результаты анализа чешского, немецкого и русского корпусов подтверждают предположение о том, что семантику стихотворного размера со временем сложнее распознать. В голландских же песнях метр и смысл сохраняют одинаковую силу связи на протяжении 200 лет.
Можно ли предсказать последующую семантику метра, зная семантические особенности этого размера в более ранний период времени (и наоборот)? Нейросеть сначала обучили и протестировали на всем наборе данных. Затем её обучили на более ранних данных и протестировали на более поздних, и наконец — обучили на более поздних данных и протестировали на более ранних данных. Зная семантический ореол какого-то метра в один период, нейросеть должна была предсказать его семантический ореол в другой период, то есть, опираясь на закономерности одного периода, расклассифицировать метры по смыслам в другом. Результаты классификации были очень разными для корпусов текстов на разных языках, что может отражать различия в их источниках и / или исторические особенности использования метра:
Таким образом, наглядное доказательство гипотез показывает связь между метром и смыслом стихотворения. Например, как пишут исследователи, в целом хорей ассоциируется с темами любви и песни, устной поэзии, национального романтического настроения. Любопытно, что “Сказка о царе Салтане” А.С. Пушкина написана четырёхстопным хореем (подражание народной поэзии) — так же, как и одно из самых известных стихотворений любовной лирики А.А. Фета:
Три девицы под окном
Пряли поздно вечерком.
«Кабы я была царица, —
Говорит одна девица, —
То на весь крещеный мир
Приготовила б я пир».
«Кабы я была царица,
Говорит ее сестрица, —
То на весь бы мир одна
Наткала я полотна».
«Кабы я была царица, —
Третья молвила сестрица, —
Я б для батюшки-царя
Родила богатыря»
(А.С. Пушкин)
Я пришел к тебе с приветом,
Рассказать, что солнце встало,
Что оно горячим светом
По листам затрепетало;
Рассказать, что лес проснулся,
Весь проснулся, веткой каждой,
Каждой птицей встрепенулся
И весенней полон жаждой;
(А.А. Фет)
Пятистопный хорей в чешском языке был размером, принятым элитой во время национального возрождения, и его отличительные темы отражают национальный пафос, народные образы и настроения гражданского восстания. Русский пятистопный хорей, напротив же, был изначально редкой формой.
Однако необходимо учитывать, что представленные наблюдения корректны в рамках конкретных силлабо-тонических традиций.
Šeļa A, Plecháč P, Lassche A (2022) Semantics of European poetry is shaped by conservative forces: The relationship between poetic meter and meaning in accentual-syllabic verse. PLoS ONE 17(4): e0266556. https://doi.org/10.1371/journal.pone.0266556
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…