Фото автора

Евгения Колпащикова

Автор

Куратор статей

О дивный «Новый мир»: что показывает сетевой анализ советских толстых журналов

Журналы «Новый мир», «Юность» и «Наш современник» стали символами эпохи оттепели. Как развивалось издательское дело в этот период? Как советские толстые журналы конкурировали за внимание читателей? И почему стихи Евтушенко скорее встретятся на страницах «Юности», а Солженицын публиковался только в «Новом мире»? Рассказываем о DH-проекте Soviet Journals Reconnected, который с помощью цифровых методов превращает советскую периодику в карту литературных связей

Брюхоногие моллюски, гастрит и редкие фамилии: как сделать языковой корпус репрезентативным

Чтобы грамотно составить корпус текстов, который помогал бы отвечать на вопросы о выбранном языке, недостаточно просто взять все книги, которые нам нравятся. Из этой статьи вы узнаете, чем опасны трубачи, которые даже не трубят, почему первое правило клуба гастроэнтерологов — не рассказывать о клубе гастроэнтерологов, стоит ли ставить на появление панамцев и как все это связано с исследованием языкового разнообразия

Как вам это понравится: погружение в мир слов Шекспира

На уроках литературы учитель предлагал нам ответить на вопрос: «Что же хотел сказать автор?». Но как ответить на него, если автор — Уильям Шекспир, а большинство слов, которые он использовал, совершенно непонятны? На помощь может прийти Shakespeare’s Words — инструмент, который способен расшифровать самые сложные и «темные» места в поэзии английского автора

Калькулятор зрелости DH-проекта

Пройдите тест и оцените, насколько «взрослый» ваш DH-проект!

Что такое фреймбанки и зачем экономистам лингвистика

Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать значение в естественном языке. Большинство из них абстрактны и редко находят практическое применение, но есть исключение — фреймовая семантика. О том, что такое семантический фрейм, как устроены базы данных таких фреймов, как специалисты по NLP применяют их для анализа рынка ценных бумаг и что такое на самом деле «завтрак», читайте в новом материале «Системного Блока»

Автор статей

Калькулятор зрелости DH-проекта

Пройдите тест и оцените, насколько «взрослый» ваш DH-проект!

Невыносимая лёгкость атрибуции: новая пьеса Милана Кундеры

Филологи уже долгое время подозревают, что одна из пьес чешского драматурга Карела Штайгервальда на самом деле принадлежит перу Милана Кундеры. Рассказываем, что по этому поводу думают цифровые филологи и специально обученные ими модели стилометрии

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как сделать это с помощью модели Whisper от OpenAI и смотрим, насколько хорошо она справляется с русскоязычными записями

Как это (не) работает: технологии нейросети-писателя

Как научить нейросеть писать в стиле Набокова? И насколько хорошо (или плохо) у нейросетей вообще получается писать художественные тексты? Могут ли нейросети привести филологов к мировому господству? Ответы на эти и другие вопросы нам дали цифровой филолог Борис Орехов и исследователь в области глубинного обучения Михаил Ким.

Стилометрия кинодиалогов: шесть жанров в поисках автора

Статья Агаты Холобут и Яна Рыбицкого The Stylometry of Film Dialogue: Pros and Pitfalls показывает связь между жанровыми особенностями кино и лексикой диалогов: с помощью стилометрии и сентимент-анализа авторы исследуют 178 фильмов из разных эпох. Рассказываем, что же у них получилось

Голос(а) автора: может ли один человек писать как несколько?

Стилометрический анализ позволяет определить, принадлежат ли тексты одному и тому же автору. Но что если писатель творит под несколькими литературными масками, у каждой из которых есть индивидуальность? Рассказываем, как португалец Фернандо Пессоа и француз Ромен Гари «обманули» стилометрию — а ученые Борис Орехов и Даниил Скоринкин исследовали и визуализировали это.