В этом году из-за коронавируса 9 мая не было парада, уличных торжеств и концертов. День Победы впервые отмечался «удаленно» — даже «Бессмертный полк» перешел в онлайн. Но одну важную практику памяти коронавирус затронуть не может: в преддверии 9 мая ежегодно возрастает посещаемость сайтов ОБД «Мемориал», «Память народа» и «Подвиг народа». Там хранятся десятки миллионов архивных записей об участниках Великой Отечественной — выживших или погибших на фронтах войны. С появлением этих ресурсов тысячи людей узнали неизвестные подробности о том, как воевал, за что награжден, где был ранен или погиб и погребен их родственник. Виктор Тумаркин — технический руководитель ОБД «Мемориал» и «Подвиг народа». В интервью изданию «Системный Блокъ» он рассказал, как лучше искать информацию о родственниках, участвовавших в ВОВ, как происходит оцифровка архивов, что нового может появиться в базах в будущем и откуда в наградном листе поэта Давида Самойлова появился сказочный нарратив.
Давайте поговорим, как вообще устроена цифровая память о войне и поиск информации?
Первый вопрос — что человек ищет. Потому что он может хотеть что-то узнать о человеке в целом, а может искать что-то целенаправленно. Это разные поиски. Утрируя, эти поиски можно разбить на три части.
Первая часть — это установление судьбы человека, который с войны не вернулся. Чтобы понять, что с ним случилось. Если человек погиб, то где он похоронен.
Второй вариант — узнать о своих близких то, что связано либо с наградами, либо с боевым путем: где воевал и чем отличился.
И третий вариант — это просто построение генеалогического древа. Вообще все, что только можно узнать о своих близких.
Получается, если мы говорим про индивидуальную судьбу и нас интересует человек, который не вернулся, то надо идти в ОБД «Мемориал». А за наградами — в «Подвиг народа». А что тогда в «Памяти народа»? Как соотносятся эти три ресурса?
Сайт ОБД «Мемориал» строго направлен на поиск человека, установление судьбы. Раньше там можно было найти только не вернувшихся с войны, сейчас появляются другие массивы информации ― документы призыва, списки частей, прохождение через военно-призывные пункты и запасные полки, учетно-послужные карты. Грубо говоря, теперь на ОБД «Мемориал» есть все про людей, кроме наград.
За наградами нужно идти на «Подвиг народа». А «Память народа» — это все перечисленное вместе плюс оперативные документы, карты действий отдельных частей, информация о командующих. Это важно для истории войны, а с другой стороны, это очень важно, когда мы ищем человека. Допустим, мы знаем примерное время и воинскую часть — можем на «Памяти народа» посмотреть, где находилась часть в это время, уже привязаться к месту, карте, что тоже бывает очень полезно.
В «Памяти народа» может быть сложнее искать, потому что там очень много другой информации, не связанной с судьбой. И награды, и всякие пересыльные пункты. ОБД «Мемориал» ― это строгий, четкий поиск по критерию, один в один. Если вы что-то указали немножко не так, как в записи, она не будет найдена. «Память народа» позволяет искать с точностью до одной-двух букв различия. Поэтому безударные гласные, например, или какая-нибудь не такая согласная, здесь не помешают найти человека.
Какой алгоритм вы бы предложили для тех, кто хочет узнать судьбу своего дедушки или прадедушки? С какой базы начинать?
Если нужна судьба, я бы предложил сначала идти на ОБД «Мемориал». Если там ничего не нашлось, можно еще попробовать на «Памяти народа». Вдруг он найдет то нечеткое совпадение, до которого человек не догадался сам.
К примеру, я пытался найти погибшую на войне студентку ИФЛИ Лию Канторович, которая была сандружинницей, то есть у нее не было военного звания. Я не нашел ее на ОБД «Мемориал», хотя пробовал по-разному, и даже испугался, что сандружинниц не вписывали в военные документы. А потом попробовал на «Памяти народа» и нашел. Она оказалась записана как КантАрович, хотя эта фамилия не пишется так.
Если есть редкая фамилия, редкое имя, редкое отчество — надо начинать искать с него. Вилка такая: если дашь очень много информации — этого может не оказаться в документе и не будет найдено. Если дашь очень мало, то записей может оказаться очень много, и все их перебирать сил не хватит. Поэтому нужно искать какой-то разумный компромисс. Начинать с самого простого, просто явно задавая ФИО, и смотреть, сколько мы такого найдем. Можно даже без года, потому что много документов, в которых нет года рождения, или он неправильный. Но, конечно, если это Иванов Иван Сергеевич, то задавать просто ФИО бесполезно.
Если человек совсем не находится, даже расширенным поиском — о чем это говорит? О том, что документ еще не оцифрован, или о том, что человек может быть в каком-то другом архиве? Насколько вообще полна база?
Можно сказать, что большая часть людей в базах присутствует. Потому что кроме документов о потерях очень много информации из подворных опросов. Эти опросы проводили после войны — опрашивали по домам, кто не вернулся, и составляли списки. Эти списки сверяли с информацией о службе в армии — и официально записывали людей как пропавших без вести. Это не дает нам много информации о судьбе, но человек при этом присутствует в списках.
Кого же нет? Документов 1941-го года очень мало. Если в самом начале войны пропал человек, и его потом не искали никакие родственники, то есть вероятность, что его не будет в нашей базе. Плохо представлены военнопленные, но мы понемногу заполняем эту лакуну. В плен попали порядка 5 000 000 человек, из них вернулись домой около 2 000 000. У нас сейчас всего 1 400 000 записей загружено (записей, а не людей, на одного человека может быть больше одной записи), а это значит, что около двух миллионов нам все еще предстоит найти.
Надеемся получить дополнительные документы из Центрального штаба партизанского движения, потому что партизаны сейчас тоже представлены слабо. Военнослужащие НКВД могли быть приписаны к обычной армейской воинской части, а могли служить в отдельных частях НКВД — например, пограничных. В первом случае данные хранятся в Центральном архиве Министерства обороны (ЦА МО РФ) и попадают к нам без проблем, а во втором содержатся в архиве НКВД. Мы уже получили оттуда большое количество информации, насколько полное, не знаем.
Военно-морские силы представлены очень хорошо, потому что в них велся качественный учет. В документах разного уровня один и тот же человек может быть представлен по пять, если не девять раз. Имеется также картотека на 150 тысяч погибших и пропавших без вести.
На ОБД «Мемориал» семья нашла брата дедушки — мы не знали, что с ним произошло и где он похоронен. Выяснилось, что он умер от ран в 1943 году в госпитале в Москве. В базе нашлась похоронка, где было написано, что он похоронен на Востряковском кладбище. Но в записи на сайте есть опечатка: он по отчеству «Каюмович», а написано «Каюшович». Пользователь ОБД «Мемориал» может как-то исправить такое?
Если документ написан от руки, и в нем можно легко перепутать, например, буквы «М» и «Ш», то проблемы никакой нет. Вы напрямую сообщаете нам — а мы уже эту ошибку правим. Но если четкими печатными буквами пропечатаны данные, и в них есть неточность, то это уже другое дело. В базу заносятся данные из архивных документов, и мы не можем ориентироваться на личные свидетельства. Наши сайты — не Книги Памяти, а банки архивных документов, и на них отражено именно то, что указано в этих документах, со всеми их ошибками.
В ОБД «Мемориал» есть раздел «Дополнительная информация», где человек может внести свои исправления и уточнения, чтобы они хранились вместе с записью. Но его читают далеко не все пользователи, это нужно понимать.
Если ошибка в самом архивном документе, лучше попробовать сделать новый документ. Для этого нужно обратиться в архив, чтобы там зафиксировали ошибку. Лучше из военкомата направить письмо с официальным запросом, а к нему приложить все подтверждающие бумаги. Тогда работники архива создают новый документ, в котором фиксируют уточнения, и подшивают этот документ в формирующееся архивное дело. В начале следующего года мы обрабатываем дела, относящиеся к периоду Великой Отечественной войны, сформированные в архиве за предыдущий год, индексируем этот новый документ и создаем новую запись в базе данных, в которой будет правильная информация.
Объемы были неподъемные, но мы их подняли
Расскажите про историю проекта. ОБД «Мемориал» был создан в 2007 году. Как вы пришли в этот проект, какова ваша история?
До 2006 года я занимался мирными делами и никакого отношения к войне не имел. А тут получил задание от президента корпорации «ЭЛАР» — за месяц нужно сделать макет банка данных, впоследствии получившего название ОБД «Мемориал», и показать его заместителю министра обороны. Из него должно быть понятно, что проект этот целесообразен и важен. Идея была понятна ― сделать ресурс, который будет совмещать разные документы, хранящиеся в разных местах.
На тот момент в рамках другого проекта уже были обработаны паспорта захоронений в Восточной Германии. Я взял несколько дел за весну 1945 года в Центральном архиве Минобороны РФ и начал их изучать. Нашел интересное донесение от апреля 1945 года о потере 32 человек, 26 из которых пропали без вести в наступлении. А потом в списке одного захоронения нашел их всех в том же самом порядке, только у нескольких были слегка изменены фамилии или имена-отчества. Получилось, что одна часть во время наступления их потеряла, а вторая подобрала и похоронила. Оставалось только сделать макет, с этим программисты справились быстро — вот два документа, один накладываем на другой. И мы людей вытаскиваем из небытия.
В 2006 году мы сделали пробный массив на миллион двести тысяч записей. Хотя уже был большой опыт с оцифровкой библиотек и архивов, работали мы фактически с нуля, потому что нужно было осваивать военную тематику и строить технологию обработки.
С самого начала было принято важное решение, что мы делаем не просто базу данных — мы делаем банк, то есть вместе с образами, сканами самих документов, из которых берутся эти данные. Индексирование данных нужно для того, чтобы запись найти. Но потом можно смотреть в оригинальном документе, что там реально написано. Чтобы пользователь мог найти и ошибки перевода информации в записи, если они возникнут, и ошибки самих документов.
Времени было катастрофически мало. Уже в 2007 году перешли к государственному заказу ― дали задание обработать 20 миллионов записей. К тому моменту команда уже набила руку, и дело пошло быстрее. Здесь нужно было построить конвейер, чтобы с такими объемами совладать.
Из чего состоял этот «конвейер по оцифровке»?
Есть две основные части конвейера. Первая часть — это сканирование. Здесь несколько шагов: разброшюровка дел, с последующей брошюровкой назад после обработки, сканирование всех этих листов, проверка качества сканирования. И в итоге получение дел в электронном виде. Это первый этап конвейера.
Второй этап — непосредственное индексирование. Здесь мы разработали свою технологию. Мы делаем разбивку документа на части, то есть из документа мы выбираем поля индексирования. Эти поля вводят разные люди, а потом все это собирается воедино, в одну запись. Есть люди, которые лучше натасканы на ввод чисел, а есть люди, которые лучше вводят буквы.
Первоначально это все делалось штатом сотрудников нескольких центров в Москве и в Зеленограде. Потом это все размножилось, у нас появились центры и в других городах. Потом стали подключать надомников. Центры уменьшились, в основном это стала работа надомников.
Для большей надежности мы внедрили разнообразные проверки — это и ручные проверки, и двойной ввод, и логические проверки сочетания полей. Например, понятно, что дата выбытия не может быть раньше даты призыва. А дата призыва с годом рождения должна иметь не меньше определенной разницы. Хотя и в самих документах бывают ошибки, но тем не менее надо проверить и убедиться, что это ошибка действительно самого документа, а не человека, который заполнял поля в базе.
Нельзя ли распознавать автоматически хотя бы то, что написано на печатной машинке?
Применить автоматическое распознавание было практически невозможно, документы зачастую и глазами-то бывают нечитабельны. Машинописная часть — это, как правило, очень плохая машинка.
Хочется оценить масштаб работы. Чтобы оцифровать миллион двести записей в первые полгода, сколько людей понадобилось на каждом этапе? Это сотни людей — или пять человек все сделало?
Нет, пять человек ― это невозможно, конечно. Хотя в начале работы людей было немного — на проверке уже набитой информации, допустим, сидело человек 20. В 2006 году набрали уже трехзначное число сотрудников. А в 2007 году, когда оцифровывали 20 миллионов записей, число стало четырехзначным. Мы тогда сходили с ума, потому что объемы были неподъемные, но мы их подняли.
Вы сказали, что большая часть людей, которые участвовали в войне, вероятно, упомянуты хотя бы в одной из баз. А можно ли на основе этих данных оценивать настоящие масштабы потерь?
Я не берусь давать оценку. Сейчас мы стараемся свести информацию из разных документов об одном человеке в одну запись. Посмотрим, чем это закончится. Эту работу вы уже можете видеть: в «Памяти народа» появилась сводная запись, в которой есть и фотографии, и информация из разных баз. Это все активизировалось к 75-летию Победы, когда стали строить главный храм и к нему Дорогу памяти.
Каковы перспективы работы по оцифровке? Какие еще данные предстоит обработать?
Первая наша цель ― закончить обработку документов из военкоматов. Туда входят в первую очередь похоронки и документы призыва. Без последних говорить о реальных потерях на войне просто невозможно, только по ним можно пытаться выводить какую-то достоверную статистику. Причем учитывая, что часть наверняка потеряна.
Следующий важный пункт ― это списки боевых частей. Из них можно вытащить многих людей, на которых нет других документов. Еще один пласт ― не обработанные документы санитарных учреждений. С их помощью, возможно, мы сможем найти неучтенных людей, умерших, к примеру, в процессе перемещения в санитарных поездах. Представляете, сколько забытых судеб это позволит найти? Нужно просматривать архивные материалы тыловых частей. Человека забрали в армию, но не факт, что он попал на фронт. Его могли отправить в тыл, и это тоже новые данные о неизвестных жизнях.
Но надо отметить, что мы работаем только с открытыми документами, и даже не представляем, что может содержаться в тех, к которым нет доступа.
Семейные истории и сказочные нарративы
Из наградных листов можно узнать о своих родственниках удивительные вещи, о которых сами участники войны в семье не рассказывали… «Лично уничтожил столько-то врагов» и т.п.
Да, во многих письмах, которые приходили, было одно и то же: «Он никогда ничего не рассказывал про войну. Вот теперь мы из наградных листов узнаем то-то и то-то». Но когда говорим про архивные документы, надо все время помнить, что они написаны языком того времени и с учетом нюансов того времени. То есть подвиги описывались так, чтобы начальство наверху не завернуло, а утвердило.
Когда только запустился «Подвиг народа», по интернету начал ходить как анекдот один наградной лист про ездового, который топором зарубил двух офицеров, бросил гранату, в одиночку уничтожил чуть ли не взвод немцев, второго офицера догнал в огороде и тоже топором зарубил. А потом еще и ценные документы на своей лошади в часть привез. И получил звание Героя Советского Союза. А что было на самом деле? На войне, конечно, могло быть что угодно, но очень уж невероятно выглядит эта история.
То есть элементы каких-то сказочных нарративов там присутствуют?
В свободное после работы время я активно занимался изучением творчества поэта Давида Самойлова. Появилась возможность сравнить его прозу и содержание документов. В наградном листе было написано, что вместе со своей частью Самойлов ворвался в траншею и лично в рукопашном бою убил трех немцев. Сам Самойлов очень подробно описывает в мемуарах этот день, и там совершенно другое. Они увидели, как один боец воюет с немецким ДЗОТом и пытается закидать его гранатами. Решили помочь. В результате ворвались в траншею и закидали ДЗОТ гранатами. Там никто не выжил. Но о том, что он лично кого-то убил, ни слова нет.
Узнали ли вы сами что-то новое про своих родственников?
Недавно писал в Фейсбуке, что нашел новую информацию о своей семье. У моей бабушки была очень колоритная сестра, которая жила в Киеве. Про войну она рассказывала только один эпизод. Со своим «топографическим кретинизмом» она заблудилась в лесу в районе передовой, а поняла, что идет не туда, когда услышала немецкую речь. Начала пятиться назад и наткнулась на нашего часового, который наставил на нее винтовку. Он разглядел в ее лице явные еврейские черты и показал: «Товарищ майор, вам сюда».
Я нашел наградный лист сестры бабушки на «Подвиге народа» и узнал, что она руководила хирургическим отделением госпиталя, сама провела большое количество операций. Для меня это было совершенной неожиданностью, я знал, что по специальности она офтальмолог. А на «Памяти народа» нашел ее фото военного времени.
Интервью: Илья Булгаков, Даниил Скоринкин
Редакторы: Виктория Багдасарьянц, Даниил Скоринкин
Иллюстратор: Анна Руденко