Мы привыкли считать сюжет признаком романа или фильма, а песню — территорией эмоций и состояний. Но почему тогда одни треки звучат как описание глубоких чувств, а другие — как законченный эпизод из чьей-то жизни? Рассказываем, как цифровые методы и литературная теория помогают увидеть (и посчитать!) движение от лирики к сторителлингу в поп-музыке
Иллюстрация: Nat Kuczyńska
Если спросить: «В каких песнях больше повествования, чем лирики?», то многие сразу вспомнят о Тейлор Свифт и ее десятиминутном хите All too well. Согласно распространенной версии, он посвящен истории отношений певицы с актером Джейком Джилленхолом.Поклонники других музыкальных направлений назовут рок-баллады из 1970-х, например Stairway to Heaven группы Led Zeppelin, или любой трек любого рэп-исполнителя про его карьерный путь из нищеты в успешную жизнь. Но мало кто будет отрицать, что все они — яркие представители высокой степени сюжетности в песнях. Но можно ли это описать с научной точки зрения? Можно ли измерить насколько песня является историей?
Еще Аристотель в своем трактате «Поэтика» [1] писал, что «историк и поэт различаются не тем, что один говорит стихами, а другой прозой. […] Разница в том, что один рассказывает о происшедшем, другой о том, что могло бы произойти». Аристотель одним из первых выделил эпос (повествовательный нарратив), лирику (от первого лица) и драму (изображение событий в действии).
Ученые Г. Г. Хазагеров и И. Б. Лобанов в «Основах теории литературы» [2] пишут, что «мысли и переживания лирического героя — это передающая форма лирики», а эпос в свою очередь — это «объективированный рассказ о жизни». К чему же в итоге относится песня?
Те же Хазагеров и Лобанов пишут, что литературные роды не являются «предписаниями». К ним стоит обращаться как к «вспомогательным схемам» для классификации текстов различных жанров. Таким образом, деление по родам не является чем-то неукоснительным, а песни не обязаны быть на одной ветке лирики общего древа родов литературы.
Чтобы решить такую нетривиальную задачу, как формализация сторителлинга, авторы исследования Measuring the Stories in Contemporary Songs [3] во главе с Дэвидом Баманном собрали корпус из 1076 текстов популярных американских песен с 1960 года. В корпус вошли песни из ежегодных списков Billboard Year-End Hot 100, в которые включаются самые популярные композиции года. Кроме того, с сайта billboard.com были собраны жанровые годовые чарты популярных песен: R&B/хип-хоп (2002–2024), рок/альтернатива (2009–2024), кантри (2002–2024) и рэп (2013–2024). Авторы также сформировали отдельную выборку песен, номинированных на премию Grammy в категории Song of the Year за период с 1960 по 2025 год.
Для измерения степени сюжетности песни исследователи выделили три показателя нарратива в текстах, которые никак не зависят от жанра или стиля (это может быть как художественный текст, так и научный или публицистический): «агент» — степень, в которой текст песни акцентирует внимание на действующих лицах, «событие» — степень организации текста вокруг последовательности событий, разворачивающихся во времени, и «мир» — степень, в которой в тексте описывается мир, который мы можем увидеть и прочувствовать. На первом этапе исследования наличие каждого показателя для каждой песни оценивалось тремя учеными по 5-балльной шкале.
Вторым этапом исследования стало машинное обучение. Нельзя просто подойти к компьютеру и спросить его, есть ли сюжет в песне. Но его можно этому обучить! Для начала на этот вопрос нужно ответить человеку, что и сделали исследователи, разметив тексты песен по тем самым трем измерениям. Уже на этом этапе было видно, что нарративность в песнях — вещь субъективная, и разметка может не совпадать у разных экспертов. Но именно в этой вариативности и заключается ценность разметки — она отражает реальное восприятие песен людьми.
Для получения более объективного результата и предсказания оценок по измерениям «агент», «событие» и «мир» авторы использовали разные модели с архитектурой BERT (в их числе RoBERTa, DeBERTa-v3, сам BERT и ModernBERT). Также в качестве эксперимента были использованы генеративные LLM (Gemini 2.5 Pro, GPT 4.1, Claude Opus 4). В процессе обучения модели на основе BERT подстраиваются под человеческие разметки, минимизируя расхождения между своими предсказаниями и оригинальной разметкой. Для больших языковых моделей исследователи написали промпт, после которого получился json файл с оценками по тем же трем измерениям. Тут важно помнить, что сама по себе модель не понимает ни текст, ни музыку, она лишь ищет статистические закономерности в языковых паттернах текста, представленных в эмбеддинговом пространстве.
После обучения модель RoBERTa лучше остальных воспроизвела человеческие оценки того, насколько песня сосредоточена на действующем лице, насколько разворачивается цепочка событий внутри песни и насколько создается ощущение мира внутри песни. И все это — без какого-либо «понимания» песни.
Изначально у исследователей была гипотеза, что песни 1960-х имели большую сюжетность, чем современные. Но результаты показали совсем обратное!
Как можно видеть на графике, пик нарративности, который, по предположению исследователей, должен был прийтись на 60-е годы ХХ века, не случился. Вместо этого уровень нарративности в песнях возрастает с каждым годом. Наибольший вклад в возрастающую степень сюжетности внесли такие жанры, как хип-хоп, который находится в топе Billboard Hot 100 уже последние 30 лет, и кантри, который получил «вторую жизнь» в 2020-х.
Авторы составили топ песен с самыми высокими показателями нарративности. Практически полностью он состоит из композиций, выпущенных еще в ХХ веке.
Самой сюжетной песней оказалась песня Вики Лоуренс The Night the Lights Went Out in Georgia, в которой рассказывается об истории, произошедшей с братом лирической героини. В первом куплете брат возвращается из отъезда, заходит в бар, перебрасывается парой фраз с приятелем Энди, который уже во втором куплете рассказывает, что жена изменяет брату с ним [4]. Как видите, уровень сюжетности в этой песне уже очень высокий. Дальше в других куплетах успевает произойти убийство, в котором брат, на самом деле, не виноват.
Тейлор Свифт со своей песней All Too Well всего лишь на 6-й строчке, уступив место в пятерке самых сюжетных песен рэперу Ice Cube с его It Was a Good Day.
Еще из интересных выводов: песни, номинированные на премию Grammy, в среднем имели больший уровень нарративности, чем песни того же жанра, которые не были номинированы, но были в Billboard Hot 100.
Исследование Measuring the Stories in Contemporary Songs показывает, что сторителлинг в популярной музыке — не исключение, а устойчивая тенденция. Более того, уровень нарративности в песнях со временем растет, а жанры хип-хоп и кантри являются самыми яркими представителями высокой сюжетности. Песня всё чаще становится не просто выражением переживания, а компактной формой рассказа.
Особенно важно, что этот вывод получен без апелляции к смыслу или биографиям исполнителей. Модель не знает, кто такая Тейлор Свифт и о чем она поет, но при этом успешно воспроизводит человеческое восприятие нарративности. Это показывает, что истории оставляют след в языке — в структуре текста, выборе слов, грамматике, — и этот след можно обнаружить количественно.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…