Читать нас в Telegram

Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске

Проект «Прожито» с 2015 года занимается оцифровкой дневников. Сейчас в их цифровом архиве опубликованы почти три тысячи документов XVIII–ХХ веков, а сам проект перебрался под крышу Европейского университета. Прочитайте наше интервью с директором центра Михаилом Мельниченко — и вы узнаете:

  • Как создавался корпус дневников?
  • Как корпус превратился в цифровой общественный архив эго-документов?
  • Кто и почему помогает исследователям оцифровывать документы?
  • Зачем извлекать имена из дневниковых текстов?
  • Как люди находят друг друга через сайт проекта?

Время чтения интервью: 20 минут

«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных

Если у вас есть корпус эго-документов, то его можно исследовать количественными методами, добывая новое знание. Например, тематическое моделирование позволяет обнаруживать темы, которые содержатся в текстах. Как это выглядит, можно увидеть в нашем исследовании дневников, собранных проектом «1917. Свободная история». Мы рассказали:

  • Чьи дневники вошли в изученный корпус?
  • Как подготовить данные для тематического моделирования?
  • Какими словами писали о войне, революции, культуре в 1917 году?
  • Какие события конца 1916 — начала 1918 года отразились в дневниках современников?

Ещё мы  повторили это исследование на материале дневников центра «Прожито» и сделали визуализацию.

Время чтения статьи: 12 минут

«Размечено»: как распознавать именованные сущности в исторических дневниках

Одна из задач, с которыми сталкивается исследователь мемуарных документов, ― распознавание имён и названий. Сделать это вручную можно только на небольшом корпусе, но если у вас сотни или тысячи записей, потребуются цифровые технологии. Мы опубликовали гайд, который поможет вам разобраться с поиском именованных сущностей в массиве текстов. Вы узнаете:

  • Как мы подготовили корпус дневников «Размечено»?
  • Какие типы именованных сущностей мы искали?
  • Как выглядел процесс разметки корпуса?

Время чтения: 15 минут

Chekhov Digital: как Чехов писал письма жене и куда течёт время в его текстах

К эго-документам относятся не только дневники, но и письма. Центр цифровых гуманитарных исследований ЮФУ совместно с Южным научным центром Российской академии наук и Высшей школой экономики выпустил семантическое издание текстов А. П. Чехова Chekhov Digital. В него вошло всё, что опубликовано в полном собрании сочинений писателя в тридцати томах. С помощью методов кластеризации и стилометрического анализа мы изучили его письма за 1899–1904 годы. Мы выяснили:

  • Кому писал Чехов?
  • Как различался стиль его писем к жене и к другим людям?
  • О чём могут говорить стилистические вариации в письмах?

Время чтения: 10 минут

Читаем секретные письма опальной королевы: историческая криптография на примере Марии Стюарт

Если письма зашифрованы, ученым требуются методы исторической криптографии — науки, которая занимается взламыванием кодов в документах прошлого. Участники международного проекта DECRYPT смогли прочитать тайную переписку королевы Шотландии Марии Стюарт с дипломатом Мишелем де Кастельно. Они обменивались посланиями в конце XVI века, когда королева была в заключении. Вы узнаете:

  • Как выглядели зашифрованные письма?
  • Какие инструменты использовали учёные, чтобы прочитать код?
  • С помощью каких алгоритмов они это сделали?

Время чтения: 10 минут

«Республика учёных»: создание модели общества Раннего Нового времени

Ещё один метод исследования переписки — сетевой анализ, который помогает понять, как связаны между собой корреспонденты. Группа из Стэндфордского университета с 2013 года изучает коммуникацию между европейскими учёными XVI–XVIII веков. Они оцифровали тысячи документов, установили адресатов и адресантов, сделали количественный анализ текстов и составили сетевые диаграммы, показывающие связи внутри академической среды. В нашем обзоре этого проекта мы рассказали:

  • Как распознать рукописный текст в историческом документе?
  • Что такое просопография?
  • Есть ли отличия между письмами одного человека разным адресатам?
  • Кому и куда отправлял свои послания Эразм Роттердамский?

Время чтения: 16 минут