Активное законотворчество — один из ключевых аспектов Французской революции, изучение которого всегда представляло проблему для исследователей. На протяжении шести лет (до роспуска Конвента в 1795 году) парламентарии вносили, обсуждали, принимали или отвергали огромное количество законов и декретов, и фиксирование таких объемов на бумаге — особенно в условиях Революции — не было простой задачей. Современный историк имеет дело с несколькими альтернативными версиями сводов революционного законодательства, опубликованных современниками событий, и различия между текстами порой оказываются весьма значительными.
Таким образом, когда франко-американской командой, успешно занимающейся оцифровкой Парламентских архивов, было принято решение создать удобную в работе базу данных законов и декретов, технические вопросы обработки текста предварял выбор источника. Историки XXI века нашли союзника в печатнике конца XVIII века.
Создание Коллекции декретов и законов
Франсуа-Жан Бодуэн стал официальным печатником Национальной ассамблеи в июне 1789 года, когда предыдущая типография отказалась обслуживать взбунтовавшееся третье сословие. Его главной задачей было быстрое и качественное издание всех решений, вынесенных Ассамблеей, но и то, и другое пострадало по мере интенсификации законодательного процесса. Тем не менее именно изданные им шестьдесят семь томов Collection générale des décrets (точное название меняется от одного парламента к другому) оказались наиболее полным и заслуживающим доверия сборником, на основе которого была создана база данных Collection Baudoin.
Принципы оцифровки и рабочая инфраструктура
Скорость публикации привела к многочисленным ошибкам и опечаткам, а также сказалась на качестве бумаги и чернил. По этой причине исследователи не могли положиться на оптическое распознавание, и все шестьдесят семь томов — тысячи страниц текста — были обработаны вручную. Этот кропотливый труд позволил, во-первых, исправить очевидные огрехи публикации, а во-вторых, создать разметку, учитывающую более сложные нюансы языка декретов.
Документы конца XVIII века отличались значительной свободой орфографии; многие часто повторяющиеся в декретах слова имеют две-три-четыре равноправные формы, причем это касается не только имен нарицательных, но и собственных. Приводить их к единому стандарту было бы серьезным искажением источника, но подобное разнообразие усложняет работу с поиском по корпусу. Команда проекта разработала систему тегов, связывающих между собой разные написания слов, так что поиск, к примеру, реки L’Ouvèze покажет все вариации топонима: Louvese, Louvèse, Louveze и Louvèze. Словари всех учтенных в разметке вариаций представлены на сайте.
В базе данных предусмотрены как поиск по всему корпусу, так и возможность работать с материалом в его оригинальном формате (либо на сканированных изображениях, либо на чистом тексте). Для статических исследований добавлен фильтр, позволяющий определить точное количество упоминаний какого-либо термина в декретах, исключая повторения в заголовках, паратексте и сборных таблицах. В качестве дополнительного материала, дающего более широкую картину о политической активности парламентариев, участниками проекта был собран каталог памфлетов, обращений, отчетов и прочих ценных свидетельств эпохи, изданных Бодуэном с 1784 по 1805 год. В него вошли более пяти сотен наименований, для которых исследователям удалось установить место хранения оригинала.
Больше гуманитарный, чем цифровой? К вопросу о ценности проекта
Коллекция Бодуэн — далеко не самый высокотехнологичный проект в своей области. База данных построена на давно разработанных механизмах поиска, и с цифровой точки зрения никаких прорывов в ней нет. Даже дизайн сайта у многих наверняка вызовет снисходительную улыбку и флешбеки в прошлое десятилетие.
И все же этот проект заслуживает внимания, причем не только со стороны узкой прослойки специалистов, которым он предоставил ценнейший инструмент для изучения революционного законодательства. Пример Коллекции демонстрирует, как сам процесс перевода аналогового текста в цифровой выходит за рамки сугубо практической пользы. Из списка публикаций на сайте видно, что работы по диджитализации позволили по-новому взглянуть на язык источника, и как следствие — на законотворчество Французской революции в целом.
Источник: Декреты и законы 1789-1795: Коллекция Бодуэна