Сегодня гуманитарии стремительно осваивают цифровой мир и уже совсем по-другому смотрят на литературные произведения. В этой статье мы проанализировали книгу Филиппа Дзядко «Радио Мартын» с помощью языка программирования R и отразили в цифрах уникальность авторского стиля писателя
Иллюстрация: Ксения Здоровец
В книге «Любимое слово Набокова — лиловый» дата-журналист Бен Блатт пишет: «Через союз писательства и математики можно узнать столько нового о книгах, которые мы любим, и авторах, которых мы превозносим». Чтобы подтвердить это утверждение, мы решили проанализировать литературное произведение «Радио Мартын» с помощью количественных методов.
«Радио Мартын» — это сказка-антиутопия, которую написал главный редактор просветительского проекта «Арзамас» Филипп Дзядко. Роман повествует о жизни, борьбе, любви и смерти Мартына (человека с уникальным слухом) в мире, где не живут, а выживают. Мартын работает на радио, и, когда появляется возможность, использует радиоволны, чтобы «дать людям надежду».
«Людям очень нужно, чтобы их слышали или хотя бы слушали» (глава 3.48).
Стиль романа — отрывистая, сухая речь с частыми повторениями одних и тех же словосочетаний.
«Помолчали. Снова помолчали» (глава 2.3, а также 3.23, 3.29, 3.35, 3.4 и т. д.).
Драматическим стаккато определяется фон антиутопической повседневности: говорить нужно крайне осторожно, чтобы не сказать лишнего. Главный герой обладает особой глухотой: его мысли наполнены словами, образами и стихами, но на слух он воспринимает только короткие чёткие фразы, и сам говорит мало. Только суть. И в этом мудрость произведения.
Предельный лаконизм находит отражение и в цифрах. Их мы получили путём компьютерной обработки текста с помощью языка программирования R. Мы загрузили текст в рабочую среду R и токенизировали, т. е. разделили на более мелкие элементы (в данном случае — на предложения). После чего подсчитали количество слов в каждом предложении.
Количество слов в предложениях романа «Радио Мартын»
Мы видим, что преобладают предложения, состоящие из трех слов. В основном длина предложений колеблется от одного слова до шести. Автор нашёл действенный приём, чтобы передать атмосферу нервозности и страха.
Точка экстремума — предложение длиной в 191 слово, составляющее целую главу (3.101). В ней Мартын умирает. Наступает расслабление: герой свободен от этой жизни и наконец может выплеснуть долго копившиеся слова.
Продолжим путешествие по стилистическим особенностям романа: опустимся на уровень ниже и исследуем ещё более мелкие компоненты текста — слова. Чтобы слова сами рассказали о себе интересную историю, мы передаем текст модели, обученной на корпусе СинТагРус, для морфологического и синтаксического анализатора UDPipe (Universal Dependencies Pipeline), загруженного в виде пакета в R.
Получаем таблицу в формате CONNL-U, где каждому токену-слову соответствуют его характеристики: начальная форма (лемма), часть речи, синтаксическая разметка и др. Точность определения характеристик моделью не идеальна, но приемлема для первичного анализа.
Теперь, когда текст предстал перед нами в разобранном виде, обратимся для примера к одной группе «деталей» — к прилагательным. Мы отобрали для таблицы 30 прилагательных, встречающихся в романе чаще всего, и теперь смотрим на них, как на пазл.
На первый взгляд разрозненные перемешанные кусочки складываются в красочную картинку. Наблюдения интригуют:
1. Самое употребительное прилагательное — «другой» — выводит на первый план инаковость главного героя антиутопии;
2. Добавляют краски к портрету Мартына следующие эпитеты: «хороший», но «маленький»; «чужой», но «важный» и «живой». Окружающий его мир «большой» и «страшный», но он один из «последних», кто противостоит удушающей несвободе. Набор прилагательных довольно стандартен для любого длинного текста, но часть из них обладает негативной эмоциональной окраской, что задаёт тон повествованию;
3. На 10-м месте обнаруживается эпитет «старый» — он демонстрирует важность сюжетной линии о возвращении Мартыном найденных на почте старых писем о прежней жизни пожилым людям, которые не получили их в срок;
4. Среди 30 самых популярных прилагательных три обозначают цвета («чёрный», «белый» и «зелёный»).
Четвертый пункт оказался весьма неожиданным, потому что он прояснил выбор цветовой гаммы для обложки издания «Мартына». Изначально, по задумке автора, она была чёрно-белой, но проницательные дизайнеры заметили зелёные отсветы в палитре красок романа.
Обложка книги «Радио Мартын». Источник: Редакция Елены Шубиной
Важен ли цвет? Какое место он занимает в сюжете? Ответы нам даст анализ совместной встречаемости прилагательных, обозначающих цвет, с соседними словами в предложениях.
Провести анализ позволит всё тот же UDPipe. Мы получаем список слов, рядом с которыми чаще всего стоят прилагательные «зелёный», «чёрный» и «белый». Отображаем топ-15 токенов для каждого цвета на облаке слов: это удобный метод визуализации, где размер слова определяется пропорционально частотности употребления в тексте.
«Чёрные» словосочетания
Прилагательное «чёрный» здесь ассоциируется с тревожным, страшным: форма полицейских, наводнившие город жуки, черные дыры, внушающие космический ужас. «Чёрный человек» предвещает смерть, как и Поэту начала XX века.
«Белые» словосочетания
В «белый» окрашены приятные воспоминания о любви и домашнем уюте: простыня, рубашка, скатерть, вино…
«Зелёные» словосочетания
Зелёный — вспышка среди людей и зданий. Он сопровождает подпольную деятельность Мартына: граффити, листок, чернила, змейка (брошка его соратника). Как зелёная трава, пробивающаяся весной из-под чёрной земли.
Каждый цвет часто используется вместе с другим цветом: белый — с красным, чёрный — с белым и зелёным. Эмоционально тусклое и рваное на первых страницах, произведение постепенно преображается в живое и выразительно красочное.
По «облакам» также видно, что автор использует лексические повторы для усиления эффекта. И только в третьем «облаке» место основного зелёного занимает его оттенок — изумрудный.
Итак, мы проанализировали замечательный роман «Радио Мартын» с помощью языка программирования R. Цифровые инструменты позволили нам увидеть авторские приёмы и техники, выраженные в объективных показателях длины, частотности и т. п.
Код для самостоятельного воспроизведения подсчётов доступен по ссылке. А подробнее о возможностях R читайте в материале «Системного Блока» об исследованиях Ольги Алиевой, которая научила всем используемым методам автора этого текста.
1. Блатт Б. Любимое слово Набокова — лиловый. Что может рассказать статистика о наших любимых авторах [пер. с англ. Нестеркиной Н. С.]. М: Эксмо, 2019. 288 с. (дата обращения: 24.01.2024)
2. Дзядко Ф.В. Радио Мартын. М.: Издательство АСТ: Редакция Елены Шубиной, 2023. 478 с. (дата обращения: 24.01.2024)
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…