Историки часто занимаются процессами большой длительности, глобальными явлениями, политическими и экономическими структурами. Такая история может показаться несколько сухой, неживой, статичной. В ней недостает биографических подробностей из жизни конкретных людей. Такова история Средневековая, в которой, по сравнению с позднейшими периодами, сохранилось не так много биографических данных.
Что такое просопография и просопографические базы
Изучением коллективных биографий, сбором данных о персоналиях того или иного периода занимается специальная историческая дисциплина — просопография. Она помогает «оживить» историю, собирая и изучая данные о жизни разных групп людей: например, землевладельцев, торговцев или дипломатов.
Понятие «просопографической базы данных» появилось в середине XX в. Однако тогда доступность этих баз, их полнота, а также удобство работы с ними были ограничены уровнем развития технологий.
В последнее время появилось много проектов, занимающихся публикациями подобных баз данных (БД) в Сети. В нашей статье мы рассмотрим 2 популярные базы: с информацией о жителях англосаксонской Британии (Prosopography of Anglo-Saxon England, PASE) и базу по Византийской просопографии (Prosopography of the Byzantine World, PBW).
На первый взгляд, оба проекта похожи. Обе базы данных представляют собой агрегированные данные из нескольких источников. Для англосаксонской базы PASE источниками стали «Книга Страшного суда» (свод материалов переписи, проведенной после норманнского завоевания Англии) [1] и некоторые донорманнские документы. В базу «Просопография Византийского мира» включены документы арабского происхождения, интегрированы оцифрованные изображения византийских печатей, хранящихся в коллекциях по всему миру.
Как устроены базы
Оба проекта, которые нас интересуют, построены с помощью методологии фактоидов — элементов, содержащих минимальное количество информации о ключевом поле, включенном в просопографическую базу данных (далее ПБД). Дж. Брэдли (руководитель просопографических проектов Лондонского Королевского Колледжа) схематично объясняет идею фактоида при помощи графа отношений между объектами в базе:
Таким образом, мы видим, что совершенно разные по форме и содержанию поля БД составляют один ее фактоид, позволяющий производить дальнейшие исследования и осуществлять поиск.
Поиск по фактоидам и карта земельных владений
Теперь подробнее разберемся с тем, как устроен поиск в ПБД по англосаксонской Британии.
Для начала заметим, что проект, представленный на сайте — это интеграция нескольких целостных баз данных: о «Книге Страшного суда», а также иным письменным источникам разных типов в рамках данного периода. В Интернете опубликована вторая версия этой ПБД: PASE-2.
Поиск здесь можно осуществлять как по фактоидам, которые могут быть отсортированы по 6 полям (персоналия, источник, владения, локация, событие, содержащие текст), так и по персоналиям. Даты приводятся по данным «Книги Страшного суда» и по нумизматическим данным, что позволяет уточнить их. Для персоналий с одинаковыми именами авторами была введена специальная система нумерации, которая также позволила включить в БД поля по людям с неизвестным именем. При поиске мы можем получить краткие биографические данные по персоналии и связанные с ней фактоиды, для которых важны данные о грамотах, где упоминается тот или иной человек. В результатах приводятся краткие данные о публикации, источнике и предшествующей истории его изучения.
Однако это не весь поисковый функционал, реализованный авторами проекта. Данные о землевладении и сеньориально-вассальных отношениях были сопоставлены с данными грамот, а затем с использованием ГИС нанесены на карту острова Великобритания. В этом разделе можно посмотреть распределение владений в англо-саксонский и нормандский период; участки, «привязанные» к карте, можно отфильтровать по форме владения: полный сеньор, вассал, подвассал и т.д.; на персональной странице, где и отображается карта, предполагается группировка основной информации о персоналии: варианты написания имени в хартиях, «Книге Страшного суда» и др., написание имени в различных изданиях источников, краткая биография, краткая библиография относительно деятельности данной персоналии. К сожалению, на данный момент, эта информация размещена не на всех страницах персоналий, однако, по заявлениям авторов проекта, базы продолжают пополняться и эти поля планируется заполнить. Всего база данных PASE-2 включает данные по 19 807 персоналиям и 282 026 фактоидам, что в разы превышает количество данных, собранных в ее первой версии.
В целом, проект представляет собой хорошо организованную, но все еще не до конца заполненную ПБД. Это можно объяснить особенностями средневековых текстов, с которыми работают авторы проекта, а также трудностью идентификации отдельных индивидов, потребовавшей разработки методики дополнительного именования. По заявлениям авторов, материалы проекта могут быть использованы историками для проведения исследований, однако требуют привлечения дополнительных материалов.
Примечание: Проекты Domesday Book base, PASE-1, PASE-2 создавались на базе Факультета цифровых гуманитарных наук Королевского колледжа Лондона. Антологию всех просопографических проектов данного исследовательского центра можно посмотреть на GitHub по ссылке.
Просопография византийского мира
Теперь обратимся к другому проекту, предполагающему создание большой просопографической базы данных, а именно к «Просопографии византийского мира» [2]. Как и предыдущий, он был выполнен в Королевском колледже Лондона, но другими авторами. Проект занял больше времени, чем база PASE: его разрабатывали с 2000 по 2016 гг. Разнообразные источники, данные которых были включены в базу, охватывают период с 1025 по 1204 гг. Эта база, как и предыдущая, основана на принципах фактоидной просопографии, которые активно разрабатывались английской школой цифровых гуманитарных наук в 1990-е гг. [3].
Привлечение данных историописания, других нарративных источников и печатей позволило авторам реализовать идею о поиске по хронологии. Если задать год в рамках указанного периода, то поиск будет производиться по фактоидам по хронологии с указанием события, вовлеченных персоналий и т.д. Однако, как отмечают сами авторы, не все события могут быть точно датированы. Поэтому события с неизвестной или спорной датой были помещены под некоторыми примерно соответствующими годами без уточнений. Интерфейс страницы поиска выглядит так:
Кроме того, привлечение такого специфического источника, как печати, позволяет уточнить данные по отдельным фактоидам и персоналиям, а также провести поиск по музейным коллекциям, где они хранятся, прочесть транскрипцию с реверса и аверса конкретной печати.
Также доступен обычный режим поиска по латинскому алфавиту или в текстовом формате по персоналиям (указаны варианты написания имени, упоминания в нарративных источниках и краткая информация о персоналии); можно осуществлять избирательный поиск по 9 полям (имя, пол, период активной деятельности, источники, локация, должности, занятие, этническая принадлежность, языки). В интерфейсе сайта результаты выдаются так, как показано на скриншоте (поля, по которым нет данных, отсутствуют, а персоналии, имена которых неизвестны, названы «Anonimus номер N»).
Важным отличием византийской базы от англосаксонской является источниковедческий аспект: привлечение разных типов источников дает разные результаты и может помочь исследователям. База данных «Просопография византийского мира» позволяет быстро найти персоналии, упомянутые в нарративных источниках более чем за 150 лет на различных языках, использовавшихся в регионах империи: латинском, греческом и арабском. Отметим еще и возможность поиска по хронологической шкале.
Если говорить о технической стороне этого проекта, то он также представлен в своей второй версии (2016 г.), однако присутствует ссылка и не более раннюю (2011 г.), которая охватывает меньший круг источников. Данные в этой базе представлены в виде Связанных открытых данных (Linked Open Data, LOD) — это опубликованные структурированные данные, каждый элемент которых имеет отдельный URI, представлен в формате RDF (Resource Description Framework [4]) и связан с другими данными. Несмотря на это, проводить полноценные статистические исследования на ее основании невозможно, поскольку это не более чем данные источников, публикация которых не имеет целью отразить реальное состояние византийского общества обозначенного периода. База может лишь показать внутренние связи между персоналиями, упомянутыми в текстах.
По выражению самих авторов, база никогда не станет полной, но будет постоянно пополняться новыми данными из изданий источников, найденных печатей и т.д. В отдельном разделе представлены списки использованных справочных изданий, публикаций источников и научных работ, основанных на материалах этой ПБД.
Подведем итоги:
- Возможности обоих проектов широки, но в то же время ограничены особенностями использованных источников: их типологией, содержанием, полнотой и т.д. Поисковые инструменты, доступные пользователям, также зависят от исследовательских интересов авторов проектов, их поля деятельности;
- ПБД могут быть полезны как в качестве дополнительного справочного инструмента историка-исследователя, так и в качестве самостоятельного источника для составления коллективных биографий, исследования связей внутри самих источников, отдельных статистических исследований;
- Публикации ПБД в сети — это масштабные междисциплинарные научные проекты, в которых задействовано большое количество ученых-гуманитариев и разработчиков технических решений: такие объемы данных требуют развития методики их сбора, организации, размещения, хранения, вызова и других операций.
Источники
[2] Источник
[3] Источник
[4] RDF