Филология

Байрон, Данте и Марк Твен: рассказываем про хорошие литературные корпуса

Что общего между рефлексирующим Данте, загадочным Байроном и неутомимым Твеном? Правильный ответ: у каждого из них есть свой цифровой литературный веб-корпус! Небольшой спойлер: интересно будет не только исследователям

Поясни за смайлик: смех и слезы в интернете

Рассказываем, как люди начали пользоваться эмотиконами — и как теперь их семантику изучают компьютерными методами. Посвящается тем, кто хотя бы раз не смог понять, что означает сообщение со смайликом

Как измеряют эффект Вертера

Но не тот, о котором вы подумали. Мы расскажем не о последствиях трагической любви, которые заставляют молодых людей с разбитым сердцем сводить счеты с жизнью, а о том, как «Страдания юного Вертера» перекликаются с окружающими его текстами

Как менялись песни Битлов и можно ли вычислить эмоции компьютерными методами?

От She Loves You до She’s So Heavy: как психологи исследовали композиции Beatles цифровыми методами и ранжировали их от радостных — до депрессивных

Вся классика в один клик: как выделить из текста события

Школьники, зависающие на сайтах с краткими содержаниями, многое бы отдали за чудо-ресурс, которому можно было бы отдать какое-нибудь художественное произведение и получить взамен описание событий в тексте. Возможно, в скором будущем их мечта воплотится в реальность. Рассказываем, как работает технология извлечения событий из художественных текстов — и что она позволяет узнать о литературе уже сейчас

Все переплетено: как распутать социальную сеть раввинской литературы

Что может рассказать об истории иудаизма социальная сеть мудрецов которые четыре века только и делали, что спорили?

Есть ли стиль у переводчика? А если найдем?

Как инструменты стилометрии помогают исследовать относительную силу стилистического отпечатка автора и переводчика в художественном тексте

Искусственный интеллект тренируется на сказках

Как научить машину увлекательно пересказывать тексты, и чем здесь могут помочь Герои и Злодеи из разных сказок, а также великий фольклорист Владимир Пропп

Краудсорсинг в Digital Humanities: опыт Латвийского фольклорного архива

Рассказываем, как фольклорному архиву Латвии удалось привлечь тысячи волонтеров к оцифровке и обогащению своих электронных коллекций, а также почему это может быть полезно другим странам

ОТСТАВНОЙ КОЗЫ ПРОДЮСЕР: генерируем названия книг Дарьи Донцовой

Как генерировать названия детективов в стиле Донцовой с помощью списка фразеологизмов, семантических векторов и морфологического анализатора

Многомерное «Слово о полку Игореве»: от кукушки до алкогольного брендинга

Когда мобильный интернет был экзотикой, а отчёты по грантам сдавали на 3,5-дюймовых дискетах… в Рунете уже были цифровые гуманитарные проекты! Рассказываем в лицах и деталях об одном из них — о параллельном корпусе переводов поэмы «Слово о полку Игореве», которая отметила 13-летие. В конце поста бонус — обзор исследований на основе корпуса

«Шахерезада»: робот, рассказывающий истории

Разбираемся, как работает алгоритм генерации историй «Шахерезада»

Сети Чехова: откуда вырос «Вишневый сад»

А.П. Чехов переизобрел драматический театр. Его роль в истории драматургии сравнима с ролью Эйнштейна в физике и Джобса — в мобильной электронике. В день 160-летия Чехова рассказываем о том, как посмотреть на его творчество через цифровую оптику — и что может дать такой взгляд.

Код «Мастера и Маргариты»

Как устроен шедевр Булгакова: анализируем роман «Мастер и Маргарита» с помощью методов цифрового литературоведения

Компьютер нашёл автора пьес Мольера (спойлер: это Мольер)

Статистика дает ответ на вопрос, который давно волнует исследователей классической французской литературы: писал ли Мольер свои произведения, или за него все сделал Корнель?

Нейросеть помогла ученым разгадать античные тексты

Алгоритм умеет восстанавливать надписи, сделанные несколько тысяч лет назад — и, как утверждают создатели, делает это быстрее, чем профессиональные исследователи эпиграфисты

Соцсети русской драмы, часть II Ревизор vs. Городничий: кто же главный герой?

Как, сколько и с кем общаться, чтобы стать по-настоящему главным героем пьесы — отвечает математика

Когнитивная стилистика и образование речи

Никогда не задумывались, как мы строим предложения? Конечно, нет, это невозможно. Молодая наука когнитивная стилистика объясняет, почему

Цветокоррекции в стихах Сергея Есенина

Поэзия — цветной вид искусства. В отличие от фотографии и кино, она никогда не была черно-белой. Поэты в своем творчестве окрашивают не только физические объекты, но и запахи, звуки, тактильные ощущения… А можно ли исследовать цветовую картину мира отдельного поэта с помощью цифровых методов?

Разделяй и определяй, или Кто автор «Сна в красном тереме»

Как метод Дельты Бёрроуза и тематическое моделирование помогают решить проблему атрибуции текста

Соцсети русской драмы, часть I: основы сетевого анализа

Сегодня модно исследовать художественную литературу методами анализа социальных сетей. Мы начинаем серию постов по сетевому анализу русской драматургии. В первом посте мы расскажем, как сетевой анализ позволяет посчитать «влиятельность» литературного героя

Красота и божественная слава: статистический анализ Корана

Исследование священных текстов с помощью методов автоматической обработки языка и статистики — то, с чего начались современные Digital Humanities. Сегодня статистика применяется для анализа священных тексты разных религиозных традиций, в том числе исламской. Публикуем перевод недавней работы, где анализируется соотношение божественных черт в Коране

Биты или манускрипт: кто выживет в борьбе со временем?

Так ли просто сохранять цифровые объекты? Как это делают сейчас? Чем озадачены ученые всего мира? Немного простых ответов на сложные вопросы современности

Тест Тьюринга для киберпоэтов

Как обычный «слепой тест» по отделению машинной поэзии от той, что написана людьми, приводит ученых к философскому спору об относительности понятия «человека» в искусстве

Что случилось с самыми унылыми стихотворениями XIX века

Элегия — ключевой поэтический жанр «‎золотого века» русской поэзии. Что можно узнать о нем, используя количественные методы, такие как подсчет статистики словоупотреблений, тематическое моделирование, регрессионный анализ длины стихотворений? Рассказывает филолог Тоня Мартыненко (Тартуский университет)

Странные языки

Чем английский необычнее венгерского? Лингвисты вычислили странность 239 языков мира и составили рейтинг

Интерфейс как посредник

Чем является интерфейс для цифрового гуманитария? Всегда ли он должен быть простым? Должен ли ученый понимать, что происходит «там под капотом»? Разбираемся с помощью акторно-сетевой теории

Электронный след Анны Ахматовой

Учимся визуализировать открытые геоданные на примере Ахматовских мест в Москве. К 130-летию Анны Ахматовой.

В начале было слово… а в конце его уже не было

Почему в начале английского романа ты должен пообедать, а в конце жениться… или умереть?
Рассказываем, когда у мистера Дарси наступает кризис среднего возраста, Оливер Твист превращается из мальчика в тинейджера, а главное, при чем тут ключевые слова и как они могут влиять на структуру романного сюжета?

Гендерные трудности английской литературы

За двести пятьдесят лет положение женщин в обществе изменилось, и эти изменения затронули не только реальную жизнь, но и книжное пространство. Как изменялось место женщины в литературе как автора и персонажа? Возможно ли определить пол героя по его описанию? И, наконец, существует ли мужская и женская литература?

Путешествие во времени с рентгеном и нейросетями

Как цифровые методы помогают читать средневековые тексты в запечатанных конвертах и внутри закрытых книг

100 лет фантастики в цифрах

Когда фантасты начали писать про искусственный интеллект и магический феминизм и разлюбили инопланетян?

Как лингвистика стала близкой подругой математики и информатики?

История сближения науки о языке с компьютерными науками

Пушкин, терминатор и звездолет

Тестируем семантический поисковик по стихам великого русского поэта — и ловим кайф

Жутко громко, запредельно тихо: звуки в романах

Крик, рёв, бормотание, шепот: измеряем громкость в литературе

Персональный склерозник: от альбома XVII века до цифровых тетрадей

Почему XXI век — золотой век альбомов и чем хороши сервисы заметок

«Жить и умереть в Париже»: 300 лет русской поэзии на карте

Задумывались ли вы о том, какие города и страны чаще всего упоминаются в стихах русских поэтов?

Второе пришествие кокаина: наркостатистика в Google Books

Наркотики, как и кинозвезды, имеют свои моменты популярности — и забвения.

Смерть в сети: зачем литературоведам графы

Как анализ социальных сетей Гамлета и Наташи Ростовой помогает филологам проникать в структуру произведения и делать открытия.