Это исследование Анастасии Панасюк 2019–2020 года, которое использует количественные методы и основано на корпусе текстов популярных песен, собранный самой исследовательницей. Сайт корпуса с поисковиком открылся только в 2024 году.
Звуки на минимум. Кого считать популярной музыкой?
В любом количественном исследовании нужна осмысленная выборка. Музыкальное пространство многообразно, чёткие критерии популярности и значимости исполнителя трудно выделить, в оценке всё равно останется доля субъективности. Книги, на которые могли бы опереться авторы исследования, ещё не были опубликованы на момент его создания (например, «Не надо стесняться. История постсоветской поп-музыки в 169 песнях /1991–2021/», Институт музыкальных инициатив, коллектив авторов, «Песни ни о чём?», Новое литературное обозрение, Дарья Журкова). Поэтому список исполнителей был составлен авторами самостоятельно. В его основу легли рейтинги музыкальных журналов (Play, «Афиша», The Village, The Flow), радио и телеканалов («Русское радио», MTV, «Муз-ТВ») и просветительские материалы (курсы лекций Г. Пророкова и А. Рондарева). Все источники можно посмотреть здесь.
Каждому исполнителю была приписана условная категория «поп» или «альтернатива». Для каждой декады (1990-е, 2000-е, 2010-е годы) было выбрано по десять исполнителей из каждой категории, и от каждого в выборку попало около двадцати песен. Если у кого-то из исполнителей было меньше песен, в выборку добавлялся схожий по нише исполнитель. Например, «Чёрный альбом» группы «Кино» (1990 год) вместе с «Детским альбомом» «Поп-механики» (1996 год) занял в корпусе один слот (шестнадцать песен совместно). Ещё один слот в выборке 2010-х гг. был зарезервирован для новых песен исполнителей, которые стали популярными в предыдущие декады («Сансара» Басты). Всего в выборку вошли 1129 песен.
Список исполнителей, взятых для исследования
Тексты песен скачивались с сайта genius.com при помощи API. Исполнителей, которых не было на сайте, добавили вручную. После этого авторы разметили тексты консольным морфологическим анализатором Mystem и приступили к исследованию.
Я искала тебя. Как распознать бытовую лексику?
В комментарии к «Евгению Онегину» литературовед Ю. М. Лотман писал, что «быт — это не только жизнь вещей, это и обычаи, весь ритуал ежедневного поведения… строй жизни… Связь этой стороны быта с культурой не требует пояснений. Ведь именно в ней раскрываются те черты, по которым мы обычно узнаём своего и чужого, человека той или иной эпохи, англичанина или испанца». Давайте посмотрим, какие маркеры времени были зафиксированы миром популярной музыки.
Один из наиболее полных списков бытовой лексики содержит система семантической разметки университета Ланкастера USAS (The UCREL Semantic Analysis System). Это список категорий и размеченных в соответствии с ними слов. Например: F — Пища и Сельское Хозяйство, F1 — Пища, F2 — Напитки и алкоголь. В этой системе у слова «птица» будут категории L2 (живые существа) и F1 (пища).
Очевидно, что не все употребления слов в корпусе будут относиться к бытовой лексике, а не к другому значению слова.
Результаты по слову «птица»
Разметка USAS не дополнялась с 2006 года, а с тех пор появилось множество новых бытовых реалий. Для улучшения точности разметки можно обратиться к языковым моделям. На основе списков USAS можно было бы получить векторные представления терминов бытовой лексики, а после посмотреть, какие слова им семантически близки, и таким образом выявить бытовую лексику, не вошедшую в списки. В этом исследовании использованы только списки USAS, но было бы интересно увидеть развитие исследования более современными методами.
Люби меня, люби. О чём поют в корпусе?
Тексты песен отличаются от прозаических текстов. Но как именно? Частотный словарь Национального корпуса русского языка представляет такой список из тридцати самых частотных существительных: год, человек, время, дело, жизнь, рука, работа, слово, Россия, место, лицо, друг, глаз, вопрос, дом, сторона, страна, мир, случай, голова, ребенок, сила, конец, Москва, вид, система, часть, город, отношение, женщина.
В песенном корпусе распределение другое. В музыкальных текстах намного чаще встречаются слова, связанные с описанием или выражением чувств: любовь, день, ночь, небо, сердце, свет, душа, сон, ветер, звезда, мама, окно, дождь, утро, огонь, песня, слеза. Тринадцать слов повторяются в обоих списках: год, человек, время, дело, жизнь, рука, слово, место, лицо, друг, глаз, мир, голова.
Самые частые слова в песнях
Самые частотные слова в песенном корпусе — местоимения. На первом месте — я, на втором — ты. Песни часто построены на антагонизме двух сторон, я и ты, и корпус это демонстрирует. Также в песнях намного чаще встречается местоимение мы: в частотном словаре современного русского языка местоимение ты на 33-м месте, а мы — на 18-м. Получается, что песенные тексты намного «ближе к телу» и говорят о происходящем непосредственно между героями и близкими им людьми.
Частота местоимений, предлогов, союзов, частиц
Результаты по слову «ты»
Любить — один из самых частотных глаголов корпуса: четвёртое место после вспомогательных и модальных глаголов (быть, хотеть, знать). В Частотном словаре русского языка он занимает только 28-е место. Также в список самых частотных глаголов песенного корпуса входят глаголы забывать, ждать, оставаться, уходить, находить, верить, лететь, петь, прощать, помнить, слышать, искать, которые не встречаются среди самых частотных глаголов Национального корпуса русского языка.
Топ глаголов в корпусах
Самые частотные прилагательные — новый (первое место и в Частотном словаре), черный (23-е), белый (21-е), нужный (20-е), хороший (9-е). Любопытно, что прилагательное должный занимает в Частотном словаре третье место, тогда как в песенном корпусе только 26, зато нужный на четвёртом месте. Получается, что в песнях часто проговаривают в открытую нужды героев (Мне нужна она, мне нужна она, мне нужна она, — t.A.T.u.).
Самые частые прилагательные
Я благодарен за любые цифры. Немного статистики об исполнителях
Чтобы сделать выводы о количественном и смысловом наполнении песен более точными, из текстов были удалены повторяющиеся строки. Повтор припевов мог бы увеличить в несколько раз частотность некоторых слов, но новых смыслов бы не добавилось. Логичным решением было учитывать каждую уникальную строчку только один раз.
Тексты песен разных жанров отличаются между собой. График демонстрирует, что самые длинные тексты у исполнителей, читающих рэп, — первые шестнадцать мест. Первые места с большим отрывом занимаются Оксимирон* (375,5 слова на песню) и Каста (324 слова на песню).
Затем появляются исполнители в жанре поп: Монеточка*, Monatik, «Время и Стекло», а рэперы исчезают. За ними следуют представители русского рока: ДДТ, «Колибри», «Аквариум»*.
В следующих пунктах авторы поп и рок-музыки перемежаются; рейтинг завершают рокеры: Линда, Shortparis, «Мумий Тролль».
Средняя длина текстов
Я назову планету именем твоим. Мир популярной музыки
Имена собственные отсылают к уникальным объектам. Чтобы подсчитать, кто из авторов делает больше всего отсылок к реальному и метафизическому миру, исследователи выбрали из песен все слова с большой буквы, которые не находились в начале предложения. Как дополнительное средство фильтрации, если слово входили в первую тысячу лемм Частотного словаря, оно не включалось в подсчёты (за исключением имён собственных вроде Москва, Александр).
Упоминания названий и имён
Больше всего отсылок в текстах рэперов — Oxxxymiron*, Bad Balance, Тимати. Только в одном треке Оксимирона*, «Город под подошвой», их восемнадцать.
Дон ли, Волга ли течёт — котомку на плечо
Я не то, что Гулливер, но всё же город под подошвой
Где привидение Есенина, крест, молебен, елей
Был чужой, но Охра, Порчи, Илья — больше, чем семья
Избавь меня от ваших панацей, домашний Парацельс
Подустал? Нам насрать! Тони Старк как стандарт
Пара стран, автострад: Краснодар, Татарстан, Москвабад
Хоть по МКАД’у на старт, хоть на Мадагаскар
У Руслана в деке саундтреки к путешествию
Мост в Асгард — после, пусть просто везёт с транспортом
Моё ученье — всем, как Магомета с Бафометом
Из частотного списка собственных имён видно, что исполнители часто упоминают:
- самих себя: Настя, Потап, Каста, Фейс*, Каменский (фамилия Насти Каменских), Тимати;
- географические объекты, с которыми они связаны: Москва, Россия, Питер, Ростов;
- географические объекты, которые имеют символическое значение: Париж, Нью-Йорк, Африка, Лондон, Голливуд, Рублёвка.
Собственные имена
Текила и джаз. Хлеб, соль и вино русскоязычной популярной музыки
Упоминание еды и напитков чаще всего встречаются в текстах «Касты» и «Ленинграда», их в целом много в текстах рэперов. Также выделяются тексты Монеточки*, среди представителей русского рока лидируют Tequilajazzz и ДДТ. Монеточка*, у которой даже псевдоним — предметная лексика, ещё не раз встретится в топе рейтингов в компании рэперов.
Еда, напитки и прочее
Чаще всего упоминают вино, водку, хлеб, кофе. Частое упоминание мест — сеттинга происходящего в песнях — бар, ресторан.
Самая частая еда
В рейтинге упоминаний напитков лидируют Tequilajazz, «Скриптонит» и «Ленинград». Безоговорочное лидерство у вина, за ним следует водка. А вот пиво, коньяк и коктейли упоминают намного меньше!
Самый частый алкоголь
Вино упоминается в корпусе 63 раза, водка — 28, а пиво всего 11. Судя по всему, вино окружено поэтическим благородным ореолом, и упоминать его позволительно. Вино одинаково упоминается и в более светлых песнях, обозначенных жанром «поп» (девятнадцать раз), и в более тёмных из жанра «альтернатива» (44 раза). Водку поп-исполнители почти не упоминают (три раза), в отличие от «альтернативы» (25 раз). Пиво распределяется почти пополам (пять и шесть раз).
Получается, что пиво — более нейтральный напиток по мнению музыкантов, вино — поэтический, а водку упоминают авторы музыки «потяжелее». Любопытно, что текила чаще встречается в «поп» части корпуса (Текила-любовь).
Результаты по слову «вино»
Кстати, эти данные любопытно сравнить с реальным потреблением разных категорий алкоголя в РФ, которое исследовал «Системный Блокъ».
Все секреты по карманам, я гуляю с доберманом. Одежда
Предметы одежды чаще всего упоминают рэперы (и Монеточка*), лидеры — Bad Balance. Чаще всего упоминается карман, причём не реальный, а метафорический — как описание денежных отношений, отсутствия/наличия денег или символического капитала: Сегодня всё в порядке, на кармане есть бабки («На кармане есть бабки», Bad Balance), Тест на внимание, не спи, чья-то рука в твоём кармане («Куда надо смотреть», «Каста»).
Затем появляются слова платье, мода. С платьями ассоциируют тему межличностных отношений, свадьбы. Мода вводит тему следования трендам и противостояния им.
Самая частая одежда
Результаты по слову «платье»
Результаты по слову «мода»
Упоминания одежды по исполнителям
Трачу на это, трачу на то. Деловые дела популярной музыки
В описаниях деловых отношений и денежных вопросов лидируют рэперы. Снова появляется «карман», на первых местах Bad Balance и «Каста», часто изображающие бытовую уличную жизнь, взаимоотношения между разными институциями (институт власти, бизнеса), отношения и проблемы обычных людей. Среди них Монеточка* и ДДТ.
Упоминания денег по исполнителям
Самая частая лексика, связанная с деньгами
К настоящему колдуну. Сверхъестественное и религия
В том, что касается быта, нет равных представителям русскоязычного рэпа. Но когда речь заходит о сверхъестественном и мистике — чём-то удалённом от физического мира, но важного для внутреннего восприятия, — появляются представители русского рока. «Аквариум»*, до этого не занимавший значительных мест в рейтингах, оказывается вторым в списке. Достаточно высоко и ДДТ. За ними следует «Гражданская оборона», которая до этого не встречалась в списках. В топе появляются и поп-исполнители — Борис Моисеев (выступавший в амплуа падшего ангела) и Валерий Меладзе. Следом «Дельфин» и «Сплин», которые также не встречались в рейтингах.
Получается, что русский рок описывает мистические переживания, работает с тематикой потустороннего. К ней обращаются и поп-исполнители. Рэперов всё ещё довольно много в рейтинге, но их тексты намного длиннее, чем у представителей русского рока. 375,5 слов у Оксимирона* против 157 у «Дельфина», 142,2 у ДДТ, 130,5 у «Аквариума»*, 116 у Бориса Моисеева, 92,5 у Валерия Меладзе и 85,5 у «Гражданской обороны».
Упоминания сверхъестественного
Сверхъестественное по исполнителям
Она хотела бы жить на Манхэттене. Географические названия
О каких местах поют герои популярной музыки? Где они живут и куда стремятся попасть? В список вошли слова, которые автоматическая разметка Mystem отметила как географические названия.
На первых местах снова рэперы, но впервые в рейтинге широко представлена поп-музыка: «Кар-мэн», «Колибри», Ёлка, «Звери», «Винтаж». В альбоме группы «Кар-мэн» «Вокруг света» встречаются такие названия: «Дели», «Моя девочка из Америки», «Лондон, гудбай», «Отель Сан-Мартино», «Чио-Чио-сан», «Знойный Истанбул», «Багама-Мама», «Париж-Париж», «Орлеанский рок-н-ролл». «Колибри» спели песни «Гамбургская лирическая», «Фудзи ещё не спит», «Париж». Хитом стала песня певицы Ёлки «Прованс», 16 городов перечисляют «Винтаж» в песне «XXL».
Музыканты часто упоминают города, в которых они работают или откуда они родом: Москва, Санкт-Петербург, Ростов-на-Дону. Из городов-символов чаще всего упоминают Париж, Нью-Йорк, Амстердам и Лондон. В текстах часто встречаются туристические направления как желанные места для посещения: Сочи, Крым, Ялта. Большинство мест находятся в Европе, но встречаются упоминания городов Америки и Японии.
Появление поп-музыки в топе можно связать с тем, что в ней поют о направлениях мечты. И мечты эти существуют в реальном мире. Их можно попробовать достичь, в отличие от метафизических и мистических переживаний русского рока.
Самые частые географические названия
При нажатии на маркер открывается список цитат от исполнителей.
Географические названия в песне
Текст песни группы «Винтаж»
Топонимы по исполнителям
Выводы:
- Популярная музыка стремится говорить о любви и взаимоотношениях между людьми, их мечтах и желаниях. Самое частотное существительное — любовь, самый частотный смысловой глагол — любить. Самые частотные слова — местоимения я и ты, причем местоимения встречаются намного чаще, чем в прозаическом корпусе (ты: второе место против 33-го, мы: четвёртое место против 18-го). Прилагательное нужный на четвёртом месте, тогда как в прозаическом только на 20-м.
- Именно песни рэперов можно считать «энциклопедией русской жизни». У них самые длинные тексты, они успевают упомянуть множество бытовых реалий. Безоговорочный лидер — Оксимирон*. К текстам рэперов близки тексты Монеточки*.
- Рэперы описывают весь мир сразу: их тексты в основном концентрируются на окружающей реальности, но часто выходят за её пределы за счёт множества культурных отсылок. Поп-музыка описывает путешествия и мечты своих героев о дальних странах — это места из реального мира, к которым действительно можно приблизиться. Русский рок описывает мистические переживания и больше говорит о внутренней стороне жизни.
- В популярной музыке вино окружено благородным ореолом: из алкогольных напитков его упоминают чаще всего представители сразу всех направлений. Пиво более нейтрально, но не обладает возвышенными коннотациями. Водку упоминают представители более «тяжёлых» жанров.
Провести собственное музыкальное расследование можно здесь. У корпуса есть две версии — main и altcorp. Исследование проведено на материале «нормированного корпуса» (main). В дополнительном корпусе altcorp 37 исполнителей (Bad Balance, FACE*, Noize MC*, Oxxxymiron*, RSAC, Tequilajazzz, THOMAS MRAZ, Uma2rmaH, «Агата Кристи», АИГЕЛ, «Аквариум»*, «АукцЫон», «Баста», «БИ-2»*, «Браво», «Бумбокс», «Гражданская оборона», «Дайте танк (!)», «Дельфин», Децл, Земфира*, «Каста», Константин Никольский, «Ленинград», Линда, ЛСП, Михей, Монеточка*, «Мумий Тролль», «Несчастный Случай», «Ногу свело!»*, «Ночные снайперы», Пасош, «Самое большое простое число», «Скриптонит», «Сплин», Тимати, Хаски), и количество песен не ограничено (всего 1454, тогда как в главном «нормированном» корпусе 1129). Чтобы задать подкорпус, нужно перейти во вкладку «Выбор подкорпуса» и в графе «Выборка» указать нужный подкорпус.
Корпус опубликован на платформе tsakorpus, автором которой является Т. А. Архангельский, на сайте цифровых проектов Школы лингвистики НИУ ВШЭ.
*исполнитель или участник коллектива признан иноагентом в РФ