Михаил Мельниченко — директор Центра «Прожито» Европейского университета в Санкт-Петербурге. В интервью «Системному Блоку» он рассказал, как корпус дневников трансформируется в полноценный цифровой архив, как исследователи расшифровывают семейные связи и зачем нужна общественная архивистика.
С чего начался проект «Прожито» и что ограничивает «классическую» старую версию
Мы много лет оцифровывали дневники, заполняли метаданные, описывали авторов по простому машиночитаемому формуляру. Для каждой дневниковой записи мы кодировали дату, старались указывать место, в котором она сделана. Мы получили большой текстовый корпус: 640 тысяч дневниковых записей с середины XVIII века и почти по наши дни. Это делалось силами волонтёров, которые помогали расшифровывать рукописи и размечать публикации.
Однако для части документов (даже дневникового характера) визуальная и материальная составляющая рассказывает о реальности и авторе не меньше, чем его содержание. Ольга Берггольц прибивала дневник ко дну табуретки, чтобы спрятать: в одной из её дневниковых тетрадей есть дырка посередине. В дневники вкладывали цветы, фотографии, вырезки. У голодающего человека меняется почерк: в блокадном дневнике ты видишь, как автор постепенно теряет силу и умирает.
Ольга Берггольц прибивала дневник к днищу табуретки: в одном из её дневников есть дырка посередине
Сохранять только текст дневника, даже если он дополнен описанием материальных особенностей в метаданных, — пастеризация. Поэтому нам нужна визуальная составляющая.
Страница из дневника Н. Казакова, архив центра «Прожито» ЕУСПб
Ещё одна сложность в классической версии проекта «Прожито» — в том, что все дневниковые записи одного человека становятся частью одного большого дневника. Советский инженер Эдуард Янович за 60 лет исписал больше двухсот блокнотов с дневниками. В классическом «Прожито» всё это оказывается бесконечной простынёй текста, разбитой на записи. В то же время его блокноты — это музей советской повседневности. Они нафаршированы вложениями от конфетных фантиков до повесток в суд и содержат таблицы и графики учёта его эмоциональных состояний, по которым мы можем судить о проживаемой им многолетней депрессии.
Это музей советской повседневности с таблицами состояний человека и сложенными конфетными фантиками
У каждого из этих вложений может быть свой автор, адресат, упоминаемые лица. Все эти разнородные документы находятся между собой в разных отношениях, которые необходимо описывать с помощью некоторого количества связей, что в классическом «Прожито» делать невозможно. При разработке корпуса «Прожито» мы предполагали связывать текст и документы, но пошли неверным путем, реализовав вначале именно текстовую часть. В итоге корпус получился вполне самоходным и нужным продуктом, но неспособным к масштабированию за счёт введения новых сущностей. И для того чтобы выйти за жанровые ограничения и начать показывать пользователям всю палитру документов, с которыми работает центр «Прожито» ЕУСПб, мы решили начать разработку цифрового архива.
Об общественной архивистике и цифровых архивах
Пять лет назад мы стали частью Европейского университета в Санкт-Петербурге. Это позволило нам больше заниматься исследовательской деятельностью, перед нами встали вопросы, связанные с осмыслением текстов. Если раньше мы были волонтёрской инициативой и фокусировались на создании корпуса дневников и поискового инструмента по нему, то теперь мы стали заниматься и теорией эго-документов.
У нас появились большие книжные амбиции. Мои коллеги Анастасия и Алексей Павловские занимаются исследованием дневников блокадного Ленинграда и их места в культурной памяти. Результатом их многолетней работы стала книжная серия, которую мы издаём вместе с Институтом истории обороны и блокады Ленинграда. В 2023 году из типографии вышел второй том этой книжной серии, который посвящён тому, как вели свои дневники эвакуировавшиеся из осаждённого города ленинградцы.
Мы собрали и издали сборник блокадных дневников
Осенью 2023 мы презентовали публике первый сборник подростковых дневников — «”Хочется жить во всю силу…”: дневники подростков оттепели». Он был подготовлен филологом Ириной Савкиной и рассказывает о повседневности через самоописания советских старшеклассников.
Страница из дневника Н. Казакова, архив центра «Прожито» ЕУСПб
В 2021 году мы получили внутренний грант нашего университета — трёхгодичное финансирование на спецпроект, посвящённый цифровой общественной архивистике. Это изменило наши приоритеты
В России было несколько попыток создать демократический архив, который работал бы без какого-то специального фильтра ценности документа и принимал документы людей, не оставивших заметного следа в культуре. Прежние попытки создания такого архива в нецифровой форме уткнулись в ресурсные и иные сложности. Основных спонсоров «Народного архива» изгнали из России, и организация, в которой было 40 человек и особнячок для хранения документов, перед закрытием схлопнулась до двух человек и одной квартиры. А цифровой архив — это флешка, которую ты можешь проглотить и путешествовать с ней, куда хочешь. Мы мечтали о создании мобильного проекта, который не тянул бы за собой полтора километра архивных полок и сорок человек штата.
Мы хотим делать архивы исторически или антропологически значимых документов силами волонтёров, вместе с обществом и ориентируясь в наших задачах на общество. Хотим создать демократический архив.
До этого мы работали с очень однородными документами: дневник — это чаще всего рукописная тетрадка или блокнот с каким-то количеством текстов и иногда изображений. Но в домашнем архиве нас могут ждать любые документы и объекты, непохожие на дневники, и наша задача гибко описывать самые разные цифровые объекты хранения — вплоть до любительских устно-исторических записей, кассет и бобин с рассказами бабушек и дедушек, которые специально никто в России не собирает.
Мы хотим создать демократический архив
Получив грант, мы наладили потоковое фотографирование рукописей у нас в центре. Присоединившийся к нашей команде филолог и разработчик Андрей Муждаба сделал первую версию базы данных, в которой мы начали описывать наше цифровое хранение. У нас было, например, три терабайта копий рукописных дневников, больше десяти тысяч откопированных документов, основная масса которых — это блокноты и тетради.
Страница из дневника В. Маклакова (домашнее собрание Светланы Пискуновой)
Дело шло медленнее, чем мы планировали, поскольку мы упёрлись в вопросы, которые довольно плохо проработаны теоретически. Мы пытаемся разработать фасетчатую систему описания документа, в которой мы задаём большое количество параметров, а потом по фасетам можем фильтровать по этим параметрам; на стыке ряда параметров могут появляться интересные с жанровой или функциональной перспективы вещи.
Мы внимательны к материальности документа и параметрам, которые чаще важны музейщикам, нежели архивистам. Например, нам пришлось ввести понятие «бланк», потому что у нас есть принципиально не совпадающие по бланку и содержанию документы — например, личный дневник может вестись в какой-нибудь медицинской карте. Есть документы, в которых бланк программирует содержание (например, ежедневник), но не до конца.
Например, личный дневник может вестись в записной книжке паровозника (паровозник — это железнодорожник начала XX века — прим. ред.). С одной стороны, она задаёт некоторую подневную структуру, текст как-то коррелирует с бланком, но при этом сам автор дневника — не железнодорожник. Таких примеров довольно много. Ещё нам пришлось расхлёбывать историю с множественной копийностью документа. Например, человек вёл дневник в блокадном Ленинграде, после этого сделал авторизованную машинописную копию, отправил её Д. Гранину и А. Адамовичу для использования в «Блокадной книге» — а нам пришла частичная ксерокопия машинописной копии, на которой рукой внучки автора внесена ещё какая-то дополнительная информация. И если мы для цифрового архива описываем такой скан, не до конца понятно, что мы описываем: дневник, его авторизованную машинописную копию, правки дочки или ксерокопию.
Как устроена работа в центре «Прожито»
Волонтёры: кто они, откуда приходят и на сколько задерживаются
Мы получили первую известность как волонтёрский проект. В золотой век волонтёрства к нам приходил один волонтёр в день. За годы существования через проект прошли почти полторы тысячи участников. Когда мы стали частью ландшафта и к нам все привыкли, волонтёры стали приходить реже. Но зато десятками стали приходить студенты-практиканты.
Специфика волонтёрства: волонтёры — это в основном не те, кому это важно по работе или по их исследовательским задачам. Волонтёры — это люди, которых работа с рукописями успокаивает, которых это отвлекает от собственной деятельности, потому что это не похоже на то, чем они занимаются по работе или учёбе.
Мы изучали состав сообщества, пытались замерять, кто дольше остаётся с нами. Есть аффектированные волонтёры, которые приходят 9 мая и говорят, что они хотят работать с дневниками военного времени, — и не отвечают уже на второе письмо координатора. И таких сотни, мы их даже не учитываем в статистике. И есть просто, условно, пожилой человек с сорокалетним стажем редакторской работы, которому хочется и дальше продолжать заниматься своим делом, или молодая девушка-юрист, которой просто нравится работать с дневниками пионеров.
Страница из дневника Н. Казакова, архив центра «Прожито» ЕУСПб
Внутренняя структура: от «все занимаются всем» до деления на департаменты
Пока мы были гражданской инициативой, у нас все занимались всем. После мы пережили несколько этапов переделки нашей работы. У нас завелось капитальное планирование: пришлось завести трекер для разных типов внутренних процессов. Мы находимся в процессе деления на департаменты внутри Центра «Прожито», в котором каждый департамент отвечает за свои задачи. Мой коллега Георгий Шерстнев занимается коммуникацией с владельцами документов и юридической стороной дела, Алексей Сенюхин взял на себя весь краудсорс — рассылку документов по волонтёрам, проверку и сохранение данных.
Процесс перехода из сугубо волонтёрского проекта в университетскую структуру был плавный, но трудный. Сначала появлялись какие-то возможности взять нового сотрудника, например, мы начинали работу, а потом становилось понятно, что в текущих регламентах и протоколах мы не справляемся. Поэтому уже много месяцев на наших внутренних семинарах мы обсуждаем целесообразность всех унаследованных от старого «Прожито» процессов. Огромная заслуга в выстраивании новых рабочих процессов принадлежит Андрею Муждаба, бракующему решения, принятые когда-то «от здравого смысла», но не имеющие под собой понятной методической или теоретической основы.
Переход из чисто волонтёрского проекта в университетскую структуру был плавный, но трудный
Центр «Прожито» начал плотно взаимодействовать с архивом Европейского университета в Санкт-Петербурге. У нас самих появилось классическое хранение — то, от чего мы раньше бежали: полки, папки из бескислотного картона и архивные коробки. И одиннадцать человек, которые поддерживают и цифровую часть нашего корпуса, и классический архив центра «Прожито»: пишут методические тексты для архива, готовят книги и ведут блог проекта.
«Блог “Прожито”» — это наше небольшое медиа, в котором мы рассказываем о нашей работе, документах, об опыте чтения дневников. Исследователь, работавший с конкретным дневником, рассказывает, о чём этот дневник, почему его надо читать и на что нужно обращать внимание. Или, например, к нам поступает большой архив человека, и нам нужны волонтёры для его обработки. Тогда мы рассказываем об этом архиве — и пытаемся через такой популярный материал зазывать к нам людей для работы с этими документами.
Если говорить об аналогах в этой сфере, то есть классические архивы дневников: в первую очередь немецкий архив Deutsches Tagebucharchiv в Эммендингене. Это ролевая модель для нескольких европейских организаций, собирающих дневники. Есть даже европейская ассоциация архивов, собирающих дневники. Мы подавали туда заявку, и кажется, наша заявка была удовлетворена. Я даже не знаю, являемся ли мы сейчас её членами или нет, но это европейская архивистика по классике — они оцифровывают документы, но не выкладывают в открытый доступ из-за нерешаемых юридических проблем.
Как вырастить дерево архивов и единую базу упоминаний людей
В 2022–2023 годах мы почти перестали пополнять наш общедоступный корпус дневников, вся работа ушла под капот. Мы писали людям, которые передают нам документы, что будет неправильно сейчас публиковать только текст: «Подождите, пожалуйста, год, и мы опубликуем это сразу с привязкой к копии документа». Мы заморозили работу в социальных сетях и до весны 2023 выглядели то ли заснувшей, то ли умершей лягушкой. Но на самом деле более плотного рабочего года у нас не было за всё время существования.
Мы выглядели то ли заснувшей, то ли умершей лягушкой, но более плотного рабочего года у нас ещё не было
Сейчас мы готовимся к открытию интерфейс-каталога нашего архива — то есть совокупности зарегистрированных в нём домашних архивов и документов, содержащихся в них. В основном на момент открытия это будут рукописные дневники с текстовым слоем. Прямо сейчас текст будет с очень простой совместимой с TEI разметкой, но дальше мы будем её усложнять.
Следующие итерации проекта должны быть посвящены нуждам архивистов. Нам нужно дать инструменты кураторам домашних архивов, чтобы они могли работать со своими документами без посредничества членов команды «Прожито».
Ну и, конечно, нужды волонтёров — у нас есть мечта превратить наше сообщество в саморегулирующееся, т. е. работающее без участия координатора, только на внутреннем трекере, системе рекомендаций и правильно продуманном конвейере по проверке волонтёрами труда волонтёров.
Выделение персон
Я убеждён, что для нашего архива поиск по упомянутым персонам не менее важен, чем по документам. Я нахожу ценность «Прожито» как просопографической базы, сопоставимой с ценностью архивной базы. У нас будет огромное дерево архивов и документов внутри архивов, но это будет чисто академическое развлечение — работать с ними через расширенный поиск. Я ожидаю, что публика в основном будет работать со списком персон, к каждой из которых привязано некоторое количество документов. Этот интерфейс скорее будет востребован пользователем, хотя не все члены команды со мной в этом согласны.
Все генеалогические сервисы работают по специфическим принципам и не очень открыты к сотрудничеству — нет базы, где у каждого когда-либо жившего человека есть ID, и все гуманитарные проекты могли бы обогащать данные этой базы и сами из неё что-то брать. Идея утопическая, но здорово было бы стать такой системой. Для начала у нас будут довольно хорошо проработанные адресаты и адресанты, авторы разных уровней, которых мы знаем по документам, загруженным в наш архив.
Изображение из дневника И. Гудкова (домашнее собрание Андрея Бородулина)
Параллельно будет ещё история про упоминаемых персон, которых на порядок или два порядка больше, чем авторов. У корпуса «Прожито» огромный потенциал в этом смысле. Однажды мы выделили упоминаемых персон для 200 мемуарных текстов, у нас получилось около 60 тысяч уникальных упоминаемых персон. Сложность в том, что пока автоматическое выделение персон и других именованных сущностей может быть только черновым, поскольку сопоставление этих выделенных персон с базой уже имеющихся невозможно сейчас делать без человеческого участия.
Однажды мы выделили упоминаемых персон для 200 мемуарных текстов — получилось 60 000
Есть ещё важное пересечение с генеалогией. В основном люди, которые начинают заниматься семейной историей, после того, как они составляют семейное древо, начинают писать некоторый большой текст об истории рода и семьи. Этот текст — в жанре монтажа, в котором всё богатство домашнего архива представлено в урезанном виде, в котором цитаты из разных документов объединяются между собой комментариями автора. Этот текст играет огромную роль для семьи, на него уходит большое количество сил автора, но при этом он не введён в научный оборот. Использовать его в исследовательских целях довольно проблематично.
Одна из наших задач — популяризировать представление о том, что домашний архив должен быть единообразно описан, опубликован и доступен всем, кому он может понадобиться. Исследовательский монтаж по домашнему архиву должен быть привязан к этим документам. Кромсай, как хочешь, но дай коллегам возможность увидеть полный документ, потому что есть другая интерпретация этого документа, и он ещё много может сказать людям других специальностей.
Это одна из важнейших для меня идей: исследователь должен публиковать датасет. Если ты собрал какую-то коллекцию документов, из которых надёргал цитат, и написал свое исследование, пожалуйста, предоставь доступ к этим документам людям, которые идут по твоим следам, чтобы они убедились в твоей корректности, грамотности и смогли этим же путем прийти к таким же выводам и подтвердить своё исследование.
Одна из важнейших для меня историй: гуманитарий должен публиковать датасет
Откуда в «Прожито» берутся дневники
У нас довольно хорошая медийная история: мы много работали с коллегами из СМИ и в социальных сетях. В феврале 2022 года мы замолчали на год, но набранного разбега было достаточно для того, чтобы нам продолжали нести рукописи. Просто самотёком, из Интернета, по телефону, кто-то где-то прочёл интервью, кто-то купил сборник блокадных дневников, кто-то услышал выступление по радио с упоминанием «Прожито».
Мы возобновили работу с сотнями семей, у которых мы раньше брали только дневники, а сейчас готовы принимать переписку, фотографии и другие документы. Мы мониторим Авито, мы мониторим «Мешок», какие-то вещи не дороже 3–4 тысяч рублей мы обычно покупаем; что-то нам дарят, иногда семьи при переездах отдают на постоянное хранение.
Страница из дневника А. Булгаковой (домашнее собрание Игоря Соболева)
Нам много всего приносят с Уделки (Уделка — это блошиный рынок в Санкт-Петербурге — прим. ред.). Один из наших петербургских друзей и участников Ростислав Потапов сначали присылал копии рукописей, а после пришёл с рюкзаком купленных на Уделке бумаг: «Я медик, мне все почерка даются легко, поэтому я всё это вам уже расшифровал, скинул на почту, а сейчас дарю вам рукопись, потому что вам нужнее». Ростислав приходит к нам раз в несколько месяцев, и всякий раз это праздник. Недавно он принёс нам несколько тетрадей автора, ранние дневники которого нам уже были подарены другим участником проекта.
Среди переданных Ростиславом тетрадей нашёлся дневник от девушки-филолога, 1989–1990 года; позже она стала топ-менеджером нескольких крупных корпораций подряд, а сейчас живёт за границей. Я нашел её в социальных сетях, сумел с ней связаться. Она напряжённо спросила, может ли она выкупить дневник, а я говорю: «Мы вам готовы его вернуть просто так, только объясните, почему важный дневник продавался на блошином рынке?» И она: «Похоже, мою дачу в России обнесли».
Бывают и дневники-фальшивки. Нам не приносят фальшивых дневников Берии или Фаины Раневской, но нам приносят сильно авторизованные тексты. Например, мужчина решает издать свои дневники. У него есть концепция, что он герой-любовник, и он берёт свои дневники, набирает их на печатной машинке, начиняет их любовными победами, рукопись уничтожает — и потом получается машинописный текст подростковых дневников, в которых ему все великие и невеликие современницы отдают сердца и тела.
Мужчина берёт свои дневники, набирает их на печатной машинке, начиняет их любовными победами, рукопись уничтожает
Мы делаем дисклеймер о том, что текст опубликован с участием автора; оригинала нет, и мы не видели степень достоверности документов — и дальше ссылка на наши внутренние документы, где мы рассказываем о том, почему не стоит верить никому.
Работа со студентами
В какой-то момент был спад волонтёрства, и мы стали искать контактов в вузах и заключать договоры на удалённую практику. COVID-19 нам тоже сыграл на руку, потому что в итоге у нас есть договоры с шестнадцатью вузами. Сейчас практикантов чуть поменьше. В 2021 году за год было почти 500 студентов, удалённо прошедших у нас практику. Один студент — это один расшифрованный документ, общая тетрадь с несложным почерком.
У студентов Европейского университета в Санкт-Петербурге есть эксклюзивный доступ к тому, что у нас есть: к данным и к самим документам. В рамках совместной образовательной программы ЕУСПб и Яндекса ПАНДАН — Прикладной анализ данных — активно используются наши датасеты. В основном на этот курс набирают людей с гуманитарным бэкграундом и учат их работе с данными. Там всегда у каждого курса один из исследовательских проектов связан с нашим корпусом. Один из проектов, который делали в рамках этого курса, — языковая модель, которая пишет подростковые дневники, которые были бы более или менее неотличимы от нормального подросткового дневника. Результат был хороший, мы могли бы бесконечно пополнять наш корпус эмоционально насыщенными и не очень понятными текстами.
У нас богатый исторический, антропологический материал, поэтому историки и антропологи тоже с нами довольно плотно работают. Практически весь наш Центр читает лекции, посвящённые эго-документам, ведёт семинары, но всё-таки локомотивом нашей учебной программы является моя коллега Анастасия Павловская. Она сама — выпускница ЕУ, историк и редактор нашей книжной серии, посвящённой блокаде. Она ведет практически весь курс про эго-документы у студентов исторического факультета Европейского университета.
Истории из дневников
Мы — как передача «Жди меня». К нам приходят люди, которые говорят, что «три поколения назад был болезненный развод, и мы потеряли отношения с другой ветвью семьи, а сейчас видим, что наш троюродный дед опубликован у вас. Соедините, пожалуйста».
Личных чудесных историй вокруг проекта слишком много, чтобы остановиться на одной.
Из последних — наша участница Елена Евгеньевна Фефер заинтересовалась дневником Юрия Беневольского из собрания ЦГАЛИ. Автор — советский комсомолец, старшеклассник, ушедший на фронт прямо со школьной скамьи и очень быстро погибший. Елена Евгеньевна стала выяснять подробности жизни автора и его семьи, смогла прочесть зашифрованный фрагмент дневника об аресте его отца и добралась до архива ФСБ.
История продолжилась знакомством с детьми первой любви Беневольского. Помните передачу «Умники и умницы», которую вел Юрий Вяземский? Его мама дружила с Юрой Беневольским и после его гибели своего сына назвала в честь него. А сестра Вяземского, актриса Евгения Симонова, — главная героиня из «Обыкновенного чуда». Елена Евгеньевна пошла в театр им. Маяковского, где оставила актрисе письмо, а после состоялось и личное знакомство. Свое исследование-приключение Фефер описала в большом эссе, опубликованном в блоге «Прожито».
Расшифровка: Ксения Жакова, Елизавета Коноплева