Читать нас в Telegram
Иллюстрация: Женя Родикова

Жанр и диалоги в фильмах 

Исследование Яна Рыбицкого и Агаты Холобут (оба — Ягеллонский университет, г. Краков) посвящено анализу кинодиалогов с помощью стилометрии и сентимент-анализа. 

Авторы указывают на недостаток исследований в области киноречи, поскольку учёные склонны игнорировать диалоги, концентрируя своё внимание на визуальной составляющей. В монографии Сары Козлофф Overhearing Film Dialogue, на которую ссылаются авторы, перечислены уникальные нарративные функции кинодиалога: от выстраивания причинно-следственных связей между событиями фильма до повышения реалистичности и раскрытия персонажей. После выхода этой монографии ряд исследователей обратились к материалу диалогов из кино и телесериалов, однако, в отличие от Рыбицкого и Холобут, они по большей части применяли качественные методы анализа.

Рыбицкий и Холобут же собрали многожанровый корпус транскрибированных кинодиалогов из 178 англоязычных фильмов, охватывающий около 84 лет жизни киноиндустрии. Фильмы, вошедшие в корпус, были поделены на шесть групп: по основной теме это chick flick («мелодрама / женское кино»), vampire («вампиры») и superhero («супергерои»), по жанру это romance («романтика»), thriller («триллер») и action/adventure («экшен/приключения»). Конечно, такая категоризация довольна груба, но одной из целей исследования как раз был пересмотр этой группировки на основе полученных результатов. Возможно, фильмы будет правильнее объединять по времени или авторству?

Сетевой анализ: жанровый и авторский сигнал

Рыбицкий и Холобут начали исследование с сетевого анализа. Подробнее об этом методе можно почитать в статьях по тегу в «Системном Блоке» или в материале о Фернандо де Эррера. Но кратко принцип размещения фильмов на схеме ниже можно объяснить так: похожие с точки зрения частотных слов в диалогах фильмы располагаются рядом и соединяются друг с другом линиями. Чем выше уровень схожести, тем толще линия. Притяжение узлов в этой сети также пропорционально уровню схожести, то есть группы близких текстов оказываются ближе друг другу при укладке графа на плоскость. 

Сетевой анализ всего корпуса кинодиалогов, разделённых цветами по шести группам: экшен/приключения — красный, мелодрама — жёлтый, романтика — серый, супергерои — оранжевый, триллер — синий, вампиры — зелёный
Сетевой анализ всего корпуса кинодиалогов, разделённых цветами по шести группам: экшен/приключения — красный, мелодрама — жёлтый, романтика — серый, супергерои — оранжевый, триллер — синий, вампиры — зелёный

Можно обратить внимание на группу триллеров по центру внизу: авторы предполагают, что такие фильмы, как «Подозрительные лица», «Семь», «Бешеные псы» и «Фарго», оказались рядом не только из-за жанра, а ещё и из-за сходства в тематике преступления и драмы. Иными словами, такая группировка позволяет предположить, что стилометрический анализ «улавливает» и жанр, назначенный IMDB, и похожие особенности других жанров.

Фильмы Альфреда Хичкока, несмотря на разных сценаристов, оказались рядом, смешанные с классическим нуаром и более современной романтикой. Стилистика Хичкока-режиссёра оказалась выражена в тестах диалогов более явно, чем, например, стилистика братьев Коэн или Квентина Тарантино.

Справа на графе расположен внушительный жёлтый блок мелодрам с вкраплениями блока романтики серого цвета. Серым оказываются выделены в основном авторские киноленты, для которых менее характерны клише ромкомов. Интересное исключение — «Титаник», оказавшийся не в романтике, а в экшене/триллерах. Рыбицкий и Холобут предполагают, что это может быть стилометрическим отражением интереса режиссёра Джеймса Кэмерона к неромантическим жанрам.

«Вампирские» фильмы делятся на две группы: те, где вампиры изображены скорее в романтическом или фэнтезийном ключе, и хорроры. «Сумерки», знаменитая серия книг, а потом их экранизаций, демонстрирует постепенное «сгущение красок»: первые две части скорее романтичны, а дальнейшие становятся ближе к жанру ужасов.

Экшен и приключенческие фильмы сгруппированы в левой части графика. Интересно, что многие франшизы блокбастеров оказываются единым кластером с точки зрения стилометрии: «Пираты Карибского моря», «Матрица», «Властелин Колец» и «Хоббит». Авторы связывают это с неизменностью команды сценаристов при работе над всеми фильмами франшизы, из-за чего совпадает не только жанровый, но и авторский сигнал.

Сетевой анализ кинодиалогов из жанра «экшен/приключения» (красный) и фильмов про супергероев (оранжевый)
Сетевой анализ кинодиалогов из жанра «экшен/приключения» (красный) и фильмов про супергероев (оранжевый)

На этом графе, благодаря «изоляции» от других жанров, поджанровые нюансы становятся более явными. Например, фильмы вселенной Marvel, события которых происходят в неблагонадёжном Готэме, оказываются близки к фильмам Копполы с мафией в главных ролях.

Сентимент-анализ: какие получаются жанры?

Следующая часть исследования Рыбицкого и Холобут посвящена оценке эмоциональности кинодиалогов. На графике ниже нейтральный (полностью сбалансированный) с точки зрения лексики фильм оказался бы на уровне 0,5 по оси Y, преобладание позитивно окрашенных слов сдвигает точку выше, негативно окрашенных — ниже. На оси X расположены даты выхода фильмов.

Сентимент-анализ кинодиалогов в диахронии (цветообозначения: экшен/приключения — красный, мелодрама — жёлтый, романтика — серый, супергерои — оранжевый, триллер — синий, вампиры — зелёный)
Сентимент-анализ кинодиалогов в диахронии (цветообозначения: экшен/приключения — красный, мелодрама — жёлтый, романтика — серый, супергерои — оранжевый, триллер — синий, вампиры — зелёный)

Полными «радости» в основном оказываются «женское кино» (мелодрамы) и романтика. При этом, как показало дальнейшее исследования с учётом уже конкретных эмоций, в этих двух жанрах почти отсутствуют маркеры злости, отвращения и страха.

Изучив распределение на этом графике, авторы делают предположение, что с точки зрения сентимент-анализа правильнее разделять фильмы на более крупные категории, поскольку здесь жанровые нюансы оказываются смазаны. Так, они предлагают объединить мелодрамы и романтику в одну группу, фильмы про вампиров — во вторую и всё остальное — в третью. 

Перспективы исследований

В целом можно сказать, что стилометрический анализ достаточно успешно объединяет фильмы по жанрам на основе диалогов. Примечательно, что в одних случаях киноленты группируются по режиссёру, а в других — по автору сценария. Исключением видится только авторское кино, жанр которого определить сложнее, однако Рыбицкий и Холобут считают, что эта проблема скорее связана с жанровой классификацией как таковой, чем с её применением конкретно при стилометрическом анализе.

Несмотря на то что в начале исследования использованная классификация казалась авторам грубой, сентимент-анализ поделил фильмы на ещё более крупные категории: их стало три вместо изначальных шести.

Авторы исследования делятся своим мнением о перспективах исследования кинодиалогов. Они считают, что диалоги могут многое «сказать» о киноиндустрии в целом и её развитии в частности, поэтому эта область — перспективное поле для дальнейших экспериментов.

Источник

Holobut A., Rybicki J. The Stylometry of Film Dialogue: Pros and Pitfalls, 2020.