Сегодня филологи не только активно читают, но и активно вычисляют: авторство, особенности перевода, даже эмоции в текстах.
Основной метод такого статистического анализа – стилометрия. Он требует компьютерных вычислений и может использоваться в исследованиях художественных переводов, гендерных особенностей в языке и других целях. Но главная функция стилометрии – установить особенности стиля конкретного автора.
О том, когда и почему это может быть важно, читайте в нашей подборке стилометрических исследований.
Стилометрия: как в разное время люди искали авторов текстов
Чтобы понять, с чего начиналась стилометрия и к чему пришла сегодня, нужно пройти путь от 1440 года до 2022. К счастью, его краткий маршрут можно найти в статье.
- В чём заслуга Лоренцо Валла?
- Как экспериментировали в способах определения авторства?
- Почему шекспировский вопрос до сих пор открыт?
Компьютерная атрибуция текста: установка авторства текста
Одна из важных задач стилометрии – установить автора текста. А иногда и установить, сколько авторов над ним работали. Исследователей «Беовульфа» волновал именно этот вопрос, но договориться всё равно не получилось.
- Каковы идеальные условия для стилистической атрибуции?
- Почему даже в гуманитарных науках важна воспроизводимость эксперимента?
- При чём тут Андрей?
Время чтения: 17 минут.
Кстати, у этого спора цифровых филологов есть продолжение! Если захотите узнать ещё больше о проблеме «Беовульфа», найдёте его здесь.
Компьютер нашёл автора пьес Мольера (спойлер: это Мольер)
С Мольером вопросов не так много, как с Шекспиром, но в авторстве его пьес всё равно подозревали Корнеля. Стилометрия эту теорию опровергла, но к исследованию всё равно осталась пара вопросов.
- Почему вообще возникли сомнения в подлинности текстов Мольера?
- Как предлоги и артикли помогают установить авторство?
- Когда исследовать фрагменты было бы лучше, чем целые тексты?
Время чтения: 3 минуты.
Как менялись песни Битлов и можно ли вычислить эмоции компьютерными методами?
Исследование психологами песен The Beatles фокусировалось не просто на частотности слов, но на смене эмоций в текстах. Это стало возможно благодаря коннотациям и особому «Словарю эмоций».
- Как измерять эмоции в тексте?
- Какая эмоция в песнях The Beatles наименее предсказуемая?
- Кто из битлов отвечал за слова «girl» и «dead»?
Время чтения: 6 минут.
Тайна стихов декабриста Батенькова
Один из самых популярных стилометричкеских методов – дельта Барроуза. Он фокусируется на частоте употребления в них служебных слов, благодаря которым можно установить авторство. Пример исследования этим методом – стихи поэта-декабриста.
- Почему вообще возникла проблема верификации текстов Батенькова?
- Кто «подкинул» Батенькову чужие тексты?
- Как компьютер различал тексты разных авторов?
Время чтения: 15 минут.
Разделяй и определяй, или Кто автор «Сна в красном тереме»
Исследования древнеанглийской литературы, французской комедии XVII века, русских стихов современника Пушкина… но как насчёт авторства одного из «Четырех великих романов Китая»? Ещё один пример использования дельты Барроуза и дополнительных стилометрических методов.
- Что такое тематическое моделирование?
- Кто добавил в восьмидесятичастный роман ещё сорок частей?
- Почему даже один метод может дать противоречивые результаты?
Время чтения: 7 минут.
Есть ли стиль у переводчика? А если найдем?
Ещё одна задача стилометрии – определить точность перевода. Благодаря таким исследованиям удаётся понять, насколько точно переводчику удалось передать стиль оригинального автора, и не оказалось ли в нём слишком много собственных стилистических находок.
- Правда ли, что американский читатель не отличит Толстого от Достоевского?
- Угадывает ли компьютер автора оригинала по переводу?
- Можно ли «вычислить» особенности стиля конкретного переводчика?
Время чтения: 8 минут.