От She Loves You до She’s So Heavy: как психологи исследовали композиции Beatles цифровыми методами и ранжировали их от радостных — до депрессивных
В 1996 году психолог Синтия Уиссел опубликовала статью «Traditional and Emotional Stylometric Analysis of the Songs of Beatles Paul McCartney and John Lennon», где она сравнила между собой песни Пола МакКартни и Джона Леннона при помощи методов традиционной и эмоциональной стилометрии.
Стилометрия часто использует в качестве минимальной единицы измерения слова. Из слова можно получить множество качеств, которые помогут нам с изучением текста: его длина, его частотность и т.д.
Одно из этих качеств — это его коннотация. Коннотацией мы называем значение, выраженное через небольшое количество параметров. Так, американский психолог Чарльз Осгуд считал, что для дифференцирования значений большинства слов нам хватает трех шкал: оценка, сила и активность. Вместе эти факторы описывают эмоцию человека по отношению к тому, что это слово обозначает.
У каждой шкалы есть две крайности. Так, у оценки это «плохой» и «хороший», у силы — это «сильный» и «слабый», а у активности — «активный» и «неактивный». Коннотации каждого слова вычисляются разными способами опрашивания информантов. Об одном из таких способов можно прочитать здесь.
Иногда можно обойтись и двумя шкалами для стилометрического исследования. Уиссел так и делает: из трех шкал она рассматривает только оценку и активность. Эти значения она взяла из своего же словаря.
По-английски этот словарь называется Dictionary of Affect. Внутри него находится список английских слов, каждому из которых даны значения на двух семибалльных шкалах: оценки и активности.
К примеру, слово delighted ‘восхищенный’ имеет значения 6.4 (оценка) и 4.2 (активность), а gloomy ‘угрюмый’ — 3.2 (оценка) и 2.4 (активность).
Такой словарь при анализе текста помогает нам ответить на вопросы, связанные с эмоциональным диапазоном автора: его стиль скорее веселый или грустный, злой или спокойный и т.д.
В своей статье Уиссел пытается ответить на два вопроса:
Пол чаще повторял слова в своих песнях, а Джон чаще вставлял такие слова, как «girl» и «dead».
Со временем уменьшилась доля местоимений первого и второго лица (деперсонализация) и слова «love», что Уиссел интерпретирует как переход их творчества от любовных песен к композициям c менее приятным и активным нарративом.
Из этих результатов, кроме всего прочего, можно почерпнуть, что точки эмоционального перегиба в творчестве Леннона и МакКартни находятся между первой и второй (падают «приятность», «активность» и «радостность») и между третьей и четвертой стадией (вырастают «гадкость» и «мягкость»).
Для наглядной демонстрации результатов своих исследований Уиссел использовала т.н. часы эмоций. Выглядят они примерно так:
Это пространство с двумя осями — оценки и активности. Значения, которые проставляются в этой системе координат, не абсолютные: они нормализованы относительно корпуса из около 50 текстов, включающих в себя художественную литературу, эссе студентов, описания людьми их собственных эмоций.
Чем интенсивнее эмоции в тексте, тем вектор (т.е. расстояние от центра до точки, обозначающей текст) будет длиннее, а в зависимости от угла, который образует этот вектор, меняется и общее настроение текста. Для этого и нужна окружность, на которой обозначены различные эмоции.
Итак, вместе все песни Битлз оказываются более радостные, чем подобранный корпус. Что же будет, если расположить их песни по отдельности?
Несмотря на то, что весь набор их песен радостен, сами песни очень по-разному располагаются на часах: самой «депрессивной» оказывается песня Джона Леннона Nowhere Man, самой приятной — песня Пола Маккартни I’ll Follow the Sun.
Сложно понять, насколько эти данные достоверны. Однако интересно, что субъективное мнение критиков, что песни Джона более грустные, как будто подтверждается методами эмоциональной стилометрии. Если два разных подхода к анализу текстов приходят к одному выводу, оба подхода становятся легитимнее, и поэтому, возможно, считает Уиссел, у эмоциональной стилометрии есть право на существование.
Еще один похожий пример — анализ песен группы Radiohead.
Также можно прочитать о сборе корпуса фольклора с эмоциональными аннотациями здесь.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…