Фото автора

Евгения Колпащикова

Автор

Куратор статей

От рок-баллад до Тейлор Свифт: как алгоритмы находят сюжеты в песнях

Мы привыкли считать сюжет признаком романа или фильма, а песню — территорией эмоций и состояний. Но почему тогда одни треки звучат как описание глубоких чувств, а другие — как законченный эпизод из чьей-то жизни? Рассказываем, как цифровые методы и литературная теория помогают увидеть (и посчитать!) движение от лирики к сторителлингу в поп-музыке

Как измерить оригинальность LLM-сюжетов и почему они (пока) проигрывают человеческим

Если бы русские народные сказки создавались сейчас, то среди волшебных предметов, кроме шапки-невидимки, скатерти-самобранки и сапогов-скороходов, у героев были бы VR-очки, способные «всю правду доложить», онлайн-переводчик с волчьего языка и генератор царевых отгадок. Правда, все эти образы придуманы человеком, а может ли LLM придумать что-то интересное в области вымышленных нарративов? Разбираемся, насколько оригинальны сюжеты, которые предлагает ИИ

Исторические личности в русской прозе: кто, почему и где упоминается чаще всех?

В художественных произведениях часто упоминаются исторические личности. Что будет, если посмотреть на русскую литературу XIX века через упоминания реальных людей? Кем являются главные «герои» этой эпохи? Возможно, вы удивитесь, но это далеко не императоры и полководцы. Исследовательница из НИУ ВШЭ Дарья Герасименко попыталась ответить на эти вопросы с помощью библиотеки SlovNet

Галопом по Европам: путешествуем с героями «Войны и мира»

Что может рассказать о персонаже «Войны и мира» география его перемещений? Отражают ли путешествия героя изменения его внутреннего мира? Чем отличаются маршруты мужчин и женщин? Изучаем, как метод цифрового картографирования помогает понять роман Толстого

Есть ли поэтический стиль у ChatGPT?

Развитие ИИ продолжается: теперь он способен писать тексты, напоминающие своей формой стихотворения. Но можем ли мы назвать рифмованные строки на заданную тему поэзией? В этом материале вместо жарких дискуссий в области эстетики предлагаем читателям обратиться к статистике и путем точного анализа и сравнения выяснить — есть ли поэтический стиль у Chat GPT?

О дивный «Новый мир»: что показывает сетевой анализ советских толстых журналов

Журналы «Новый мир», «Юность» и «Наш современник» стали символами эпохи оттепели. Как развивалось издательское дело в этот период? Как советские толстые журналы конкурировали за внимание читателей? И почему стихи Евтушенко скорее встретятся на страницах «Юности», а Солженицын публиковался только в «Новом мире»? Рассказываем о DH-проекте Soviet Journals Reconnected, который с помощью цифровых методов превращает советскую периодику в карту литературных связей

Брюхоногие моллюски, гастрит и редкие фамилии: как сделать языковой корпус репрезентативным

Чтобы грамотно составить корпус текстов, который помогал бы отвечать на вопросы о выбранном языке, недостаточно просто взять все книги, которые нам нравятся. Из этой статьи вы узнаете, чем опасны трубачи, которые даже не трубят, почему первое правило клуба гастроэнтерологов — не рассказывать о клубе гастроэнтерологов, стоит ли ставить на появление панамцев и как все это связано с исследованием языкового разнообразия

Как вам это понравится: погружение в мир слов Шекспира

На уроках литературы учитель предлагал нам ответить на вопрос: «Что же хотел сказать автор?». Но как ответить на него, если автор — Уильям Шекспир, а большинство слов, которые он использовал, совершенно непонятны? На помощь может прийти Shakespeare’s Words — инструмент, который способен расшифровать самые сложные и «темные» места в поэзии английского автора

Калькулятор зрелости DH-проекта

Пройдите тест и оцените, насколько «взрослый» ваш DH-проект!

Что такое фреймбанки и зачем экономистам лингвистика

Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать значение в естественном языке. Большинство из них абстрактны и редко находят практическое применение, но есть исключение — фреймовая семантика. О том, что такое семантический фрейм, как устроены базы данных таких фреймов, как специалисты по NLP применяют их для анализа рынка ценных бумаг и что такое на самом деле «завтрак», читайте в новом материале «Системного Блока»

Автор статей

Калькулятор зрелости DH-проекта

Пройдите тест и оцените, насколько «взрослый» ваш DH-проект!

Невыносимая лёгкость атрибуции: новая пьеса Милана Кундеры

Филологи уже долгое время подозревают, что одна из пьес чешского драматурга Карела Штайгервальда на самом деле принадлежит перу Милана Кундеры. Рассказываем, что по этому поводу думают цифровые филологи и специально обученные ими модели стилометрии

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как сделать это с помощью модели Whisper от OpenAI и смотрим, насколько хорошо она справляется с русскоязычными записями

Как это (не) работает: технологии нейросети-писателя

Как научить нейросеть писать в стиле Набокова? И насколько хорошо (или плохо) у нейросетей вообще получается писать художественные тексты? Могут ли нейросети привести филологов к мировому господству? Ответы на эти и другие вопросы нам дали цифровой филолог Борис Орехов и исследователь в области глубинного обучения Михаил Ким.

Стилометрия кинодиалогов: шесть жанров в поисках автора

Статья Агаты Холобут и Яна Рыбицкого The Stylometry of Film Dialogue: Pros and Pitfalls показывает связь между жанровыми особенностями кино и лексикой диалогов: с помощью стилометрии и сентимент-анализа авторы исследуют 178 фильмов из разных эпох. Рассказываем, что же у них получилось

Голос(а) автора: может ли один человек писать как несколько?

Стилометрический анализ позволяет определить, принадлежат ли тексты одному и тому же автору. Но что если писатель творит под несколькими литературными масками, у каждой из которых есть индивидуальность? Рассказываем, как португалец Фернандо Пессоа и француз Ромен Гари «обманули» стилометрию — а ученые Борис Орехов и Даниил Скоринкин исследовали и визуализировали это.