© flickr.com

Литераторы любят говорить о словарном запасе Уильяма Шекспира: в своих работах он использовал 28 829 уникальных слов. Это позволяет предположить, что всего он знал более 100 000 слов и, возможно, имел один из богатейших словарных запасов в мире на тот момент.

Журналист Мэтт Дэниелс решил сопоставить это значение с тем, что дает анализ текстов хип-хоп-музыкантов. Для этого использовались первые 35 000 слов из текстов песен каждого исполнителя. Таким образом плодовитых музыкантов, таких как Jay-Z, можно будет сравнить с относительно более новыми, например Drake.

35 000 слов — это содержание от трех до пяти студийных альбомов и мини-альбомов. В том случае, если исполнителю немного не хватало до нужного количества слов, использовались микстейпы. У многих рэперов, например у Biggie и Kendrick Lamar, недостаточно официально опубликованных текстов песен, чтобы включить их в исследование. В качестве критериев оценки были включены количественные данные Шекспира и Германа Мелвилла с использованием такого же подхода — 35 000 слов из нескольких разных пьес для Шекспира и первые 35 000 слов из романа «Моби Дик» для Мелвилла.

Для того чтобы определить объем словарного запаса музыкантов, использовалась следующая методика лексического анализа: каждое слово считалось один раз, следовательно, слова pimps, pimp, pimping и pimpin учитывались как четыре уникальные единицы. Из корпуса текстов были удалены апострофы, чтобы избежать проблем с некоторыми парами слов (например, pimpin’ и pimpin). И все равно база слов далека от совершенства. В хип-хопе много сленговых выражений, которые трудно истолковать (например, shorty или shawty), слов-композитов, таких как king shit, и повторяющихся мотивов.

Тем не менее это исследование представляется интересным. Из 85 исполнителей, рассмотренных в рамках проекта, ниже представлены те, кто занял верхние строчки результатов.

№ 1. Aesop Rock

При первой публикации результатов Мэтт не включил Aesop Rock, посчитав его слишком трудным для понимания, но участники сообщества на сайте Reddit, посвященного хип-хопу, высказали бурное возмущение. По их утверждению, Aesop Rock точно получил бы первое место, и действительно, количество употребленных им слов оказалось значительно выше, чем у всех остальных рассмотренных музыкантов, так что его пришлось добавить в визуальную репрезентацию данных. На самом деле результат Aesop Rock должен располагаться еще правее, но автор поленился исправлять масштаб.

№ 5. Группа Wu-Tang Clan

Впечатляет, что Wu-Tang Clan занял пятое место, учитывая то, что все десять участников группы с крайне разными музыкальными стилями в равной степени участвуют в создании песен. Добавьте к этому то, что соло-альбомы GZA, Ghostface, Raekwon и Method Man’s также вошли в первую двадцатку, — в частности, GZA оказался на четвертом месте.

Рассмотрим пять студийных альбомов Wu-Tang Clan подробнее, чтобы разобраться с вкладом каждого участника группы. Ниже представлена таблица с количеством слов, написанных каждым рэпером, и процентом, которое это количество составляет от общего объема.

Разбивка первых пяти альбомов Wu-Tang по исполнителям

Чтобы проанализировать словарный запас каждого рэпера (количество использованных уникальных слов) в первых пяти альбомах Wu-Tang, был использован порог в 3500 слов, чтобы все участники оказались на равных. Таким образом удалось включить GZA, но, к сожалению, у Ol’ Ddirty Bastard, Cappadonna и Masta Killa оказалось недостаточно слов.

Количество уникальных слов (среди первых 3500 слов), использованных участниками Wu-Tang

U-God и GZA внесли большой вклад в среднее арифметическое количества употребленных слов участников группы. Вклад Raekwon и Method Man’s ниже среднего по группе, но обратите внимание, что их результат все равно оказывается выше, чем у большинства хип-хоп-исполнителей.

№ 28, 54. OutKast и E-40

Неудивительно, что E-40 вошел в верхние 20%: его считают создателем многих сленговых выражений. Примерами приписываемых ему фраз являются all good, pop ya collar, shizzle и you feel me.

У дуэта Outkast словарный запас стал частью их стиля: в песнях часто используются словослияния (ATLiens, Stankonia), присущая южанам тягучесть выговора (nahmsayin, ery’day), а также выдуманный сленг (flawsky-wawsky).

Другие исполнители, территориально расположенные на Юге, отличаются от Outkast бедностью словаря. Можно предположить, что это следствие особенности стиля кранк, для которого характерна вопросно-ответная структура — именно из-за нее слова чаще повторяются.

№ 49 и 59. Busta Rhymes и Twista

Оба рэпера известны своей скоростью чтения, поэтому отрадно видеть, что тексты их песен остаются разнообразными.

№ 101, 102, 103, 131. Kanye West, Snoop Dogg, 2pac, Lil Wayne

Некоторые из наиболее известных хип-хоп-исполнителей оказались в хвосте списка.

Lil Wayne никогда не славился особенной сложностью использованных слов, но было неожиданно, что результаты 2pac, Snoop и Kanye West окажутся значительно ниже среднего.

Так что же все это значит? Пользователь блога io9 дал Мэтту Дэниэлсу пищу для размышлений, написав, что в треке «Moment of Clarity» из альбома «The Black Album» Jay-Z сравнивает свою лирику с творчеством Common Sense и Talib Kweli (оба исполнителя располагаются выше, чем Jay-Z, на шкале величины словарного запаса):

I dumbed down for my audience to double my dollars

They criticized me for it, yet they all yell «holla»

If skills sold, truth be told, I’d probably be

Lyrically Talib Kweli

Truthfully I wanna rhyme like Common Sense

But I did 5 mil — I ain’t been rhyming like Common since

В этом речитативе Jay-Z рассуждает, как он сделал свои тексты проще и тупее — и это принесло ему миллионы. Мне хотелось бы рифмовать как Common Sense и Talib Kweli, говорит рэпер, но такое мастерство просто не продается.

Источник:THE LARGEST VOCABULARY IN HIP HOP BY MATT DANIELS