Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске
Проект «Прожито» с 2015 года занимается оцифровкой дневников. Сейчас в их цифровом архиве опубликованы почти три тысячи документов XVIII–ХХ веков, а сам проект перебрался под крышу Европейского университета. Прочитайте наше интервью с директором центра Михаилом Мельниченко — и вы узнаете:
- Как создавался корпус дневников?
- Как корпус превратился в цифровой общественный архив эго-документов?
- Кто и почему помогает исследователям оцифровывать документы?
- Зачем извлекать имена из дневниковых текстов?
- Как люди находят друг друга через сайт проекта?
Время чтения интервью: 20 минут
«Впереди сущий сахарный голод»: что говорит о дневниках 1917 года анализ данных
Если у вас есть корпус эго-документов, то его можно исследовать количественными методами, добывая новое знание. Например, тематическое моделирование позволяет обнаруживать темы, которые содержатся в текстах. Как это выглядит, можно увидеть в нашем исследовании дневников, собранных проектом «1917. Свободная история». Мы рассказали:
- Чьи дневники вошли в изученный корпус?
- Как подготовить данные для тематического моделирования?
- Какими словами писали о войне, революции, культуре в 1917 году?
- Какие события конца 1916 — начала 1918 года отразились в дневниках современников?
Ещё мы повторили это исследование на материале дневников центра «Прожито» и сделали визуализацию.
Время чтения статьи: 12 минут
«Размечено»: как распознавать именованные сущности в исторических дневниках
Одна из задач, с которыми сталкивается исследователь мемуарных документов, ― распознавание имён и названий. Сделать это вручную можно только на небольшом корпусе, но если у вас сотни или тысячи записей, потребуются цифровые технологии. Мы опубликовали гайд, который поможет вам разобраться с поиском именованных сущностей в массиве текстов. Вы узнаете:
- Как мы подготовили корпус дневников «Размечено»?
- Какие типы именованных сущностей мы искали?
- Как выглядел процесс разметки корпуса?
Время чтения: 15 минут
Chekhov Digital: как Чехов писал письма жене и куда течёт время в его текстах
К эго-документам относятся не только дневники, но и письма. Центр цифровых гуманитарных исследований ЮФУ совместно с Южным научным центром Российской академии наук и Высшей школой экономики выпустил семантическое издание текстов А. П. Чехова Chekhov Digital. В него вошло всё, что опубликовано в полном собрании сочинений писателя в тридцати томах. С помощью методов кластеризации и стилометрического анализа мы изучили его письма за 1899–1904 годы. Мы выяснили:
- Кому писал Чехов?
- Как различался стиль его писем к жене и к другим людям?
- О чём могут говорить стилистические вариации в письмах?
Время чтения: 10 минут
Читаем секретные письма опальной королевы: историческая криптография на примере Марии Стюарт
Если письма зашифрованы, ученым требуются методы исторической криптографии — науки, которая занимается взламыванием кодов в документах прошлого. Участники международного проекта DECRYPT смогли прочитать тайную переписку королевы Шотландии Марии Стюарт с дипломатом Мишелем де Кастельно. Они обменивались посланиями в конце XVI века, когда королева была в заключении. Вы узнаете:
- Как выглядели зашифрованные письма?
- Какие инструменты использовали учёные, чтобы прочитать код?
- С помощью каких алгоритмов они это сделали?
Время чтения: 10 минут
«Республика учёных»: создание модели общества Раннего Нового времени
Ещё один метод исследования переписки — сетевой анализ, который помогает понять, как связаны между собой корреспонденты. Группа из Стэндфордского университета с 2013 года изучает коммуникацию между европейскими учёными XVI–XVIII веков. Они оцифровали тысячи документов, установили адресатов и адресантов, сделали количественный анализ текстов и составили сетевые диаграммы, показывающие связи внутри академической среды. В нашем обзоре этого проекта мы рассказали:
- Как распознать рукописный текст в историческом документе?
- Что такое просопография?
- Есть ли отличия между письмами одного человека разным адресатам?
- Кому и куда отправлял свои послания Эразм Роттердамский?
Время чтения: 16 минут