Читать нас в Telegram
Иллюстрация: Надя Луценко

Военная история как open data

Как отмечает ученый Тони Жак в «Словаре сражений и осад» — наиболее полном своде данных о военных конфликтах, — исторические хроники сохранили сведения о примерно 8500 сражениях и осадах, начиная с битвы при Мегиддо (XV век до н. э.) и заканчивая операциями войны в Ираке (2003–2011 гг.).

Созданная в 2021 году Всемирная база данных исторических сражений (World Historical Battles Database, WHBD) систематизирует сохранившиеся свидетельства о военных конфликтах. База содержит информацию о примерно 8000 сражений с древних времен по сегодняшний день. Создателем базы стал ученый, доцент Осакского университета Сюхей Китамура. Основными источниками базы данных являются Wikidata и Википедия. 

Какие существуют базы данных о военных конфликтах

WHBD — не единственная попытка собрать военную историю в одну базу данных. Существует две категории ресурсов подобного рода: одни содержат информацию об исторических (до середины XX века) конфликтах, другие — о современных. 

Данные о современных конфликтах обычно более полные и по большей части находятся в свободном доступе. Исследователи современных конфликтов чаще всего обращаются к трем основным источникам:

  • Уппсальская программа данных о конфликтах (UCDP) — наиболее полный источник о событиях с середины XX века, с геопривязанными данными о случаях насилия со смертельным исходом с 1989 г.,
  • Armed Conflict Location & Event Data (ACLED) — система мониторинга политического насилия и акций протеста в реальном времени,
  • Correlates of War — база данных о вооруженных конфликтах между странами. Целью проекта является систематическое накопление научных знаний о войне.

По сравнению с данными о современных конфликтах, информация об исторических конфликтах очень ограничена. Исключение составляет «Каталог конфликтов» Петера Бреке, который содержит информацию о 3708 конфликтах с 1400 по 2000 год. Однако этот набор данных не содержит информации о местоположении, которая необходима для некоторых видов анализа.

Впрочем, существуют и печатные источники по историческим конфликтам, к которым могут обращаться исследователи: работа Дж. Брэдбери The Routledge Companion to Medieval Warfare (2004 год), посвященная европейским войнам с 269 по 1525 год, монография М. Клодфельтера Warfare and Armed Conflicts: A Statistical Encyclopedia of Casualty and Other Figures, 1492–2015 (2017 год), уже упоминавшийся выше «Словарь сражений и осад» Т. Жака (2007).

Что отличает Всемирную базу данных исторических сражений от других баз:

  1. Это одна из самых больших общедоступных баз данных об исторических конфликтах.
  2. Данные собираются отдельно для каждой воюющей стороны.
  3. База использует информацию из Wikidata и Википедии, что позволяет охватить множество сражений благодаря участию людей со всего мира. На этих ресурсах проще искать информацию, так как она хорошо структурирована.

Оцифровка истории: как создавалась база данных

Основная информация была извлечена из Wikidata и Википедии. База включает такие поля, как название сражения, дату и место (в том числе географические координаты), ссылку на статью в Википедии и наименование войны, если событие было частью более крупного конфликта.

Китамура сохранил информацию в виде файлов HTML. HTML — это своего рода «скелет» веб-страницы, тот язык, на котором она создана. Информация из Википедии была намного богаче, чем информация из Wikidata. Она содержала весь текст, доступный на страницах Википедии. Выборка на этом этапе включала 7457 наблюдений. 

Следующей задачей было извлечь информацию из файлов HTML. Чтобы сделать это, автор обратился к информации, записанной в поле «Резюме», которое отображается в правом верхнем углу страницы Википедии. Формат и стиль написания в этом поле практически всегда стандартный, и такое поле с «Резюме» имеется у большинства описанных сражений. Этот подход к копированию информации позволил избежать ошибок, которые могли возникнуть при вводе информации вручную.

Страница, посвященная Фермопильскому сражению. Источник: Википедия

Изображение ниже показывает сводное поле для битвы при Фермопилах (480 г. до н. э.). Как можно увидеть, сводное поле содержит всю необходимую информацию: дату, местоположение (название и географические координаты), итог сражения, территориальные изменения. Представлены также воюющие стороны, командиры и лидеры, численность войск и потери. 

Китамура извлек всю текстовую информацию из поля. Однако для некоторых сражений не все сведения были доступны.

Сводное поле для Фермопильского сражения. Источник: Википедия

Например, переменные «численность» и «потери» показаны как определенный диапазон значений, это необязательно точные величины. Кроме того, значения могут различаться в зависимости от источника информации. Поэтому при создании Всемирной базы данных исторических сражений Сюхей Китамура решил сосредоточиться на следующих переменных: дата (год), местоположение (название места и географические координаты), воюющие стороны и результаты. 

Каждая строка набора данных соответствует воюющей стороне, которая принимала участие в конкретном военном конфликте. Так выглядят переменные, представленные в базе данных:

  • название сражения,
  • к какой стороне принадлежит участник,
  • годы сражения,
  • название войны, к которой относится сражение,
  • наименование воюющей стороны. В некоторых случаях название воюющей стороны может быть названием коалиции (например, Организация Объединенных Наций (ООН), Аркадийская лига в Древней Греции) без указания конкретных городов-государств, участвующих в сражении,
  • результат сражения,
  • географические координаты сражения,
  • название места, где происходило сражение.

Перед началом процесса очистки данных было добавлено 643 сражения и удалено два дублирующихся наблюдения. Размер выборки достиг 8098. 

В процессе очистки была исправлена информация о названиях мест и географических координатах сражений. Автор базы данных вручную заполнил недостающую информацию и исправил несоответствия в написании названий мест. В качестве следующего шага для мест с отсутствующими координатами автор использовал OpenCage Geocoder и получил географические координаты на основе информации о названиях локаций.

Наконец, информация о сражениях была скорректирована при помощи страниц английской Википедии, Wikidata и других онлайн-ресурсов. Например, Military Wiki часто использовалась для сражений, которые были недоступны на страницах Википедии.

Где произошло больше всего сражений?

Финальная версия базы данных содержит 7741 событие в 174 странах. При этом более 2750 сражений произошли за пределами Европы и Северной Америки. 

Какие же страны воевали интенсивнее всего? Так, больше всего вооруженных столкновений было на территории США (832 события), Франции (454), Италии (391), Великобритании (381) и Испании (304), где числа в скобках указывают общее количество сражений в наборе данных. 

Китамура объясняет это несколькими причинами. Во-первых, на этих территориях действительно могло произойти больше сражений, чем в других регионах. Во-вторых, войны в этих регионах могли быть зафиксированы с большей вероятностью, и/или меньше записей могло быть утеряно. В-третьих, исходные онлайн-источники могут содержать больше сражений из этих регионов.

Распределение мест сражений по земному шару в WHBD. Сражения без геокоординат и речные сражения удалены. В результате получено 7741 наблюдение. Источник: World Historical Battles Database

Пик конфликтов пришелся на XX век, что связано с мировыми войнами. 

Наибольшая концентрация военных конфликтов в XVIII–XIX веках наблюдалась в Западной Европе (Франция, Германия, Италия, Испания) и США. Наибольшее количество сражений в этот период произошло в Соединенных Штатах (например, Американская война за независимость и Гражданская война). В числе лидеров по также — Франция в XX веке (например, Первая мировая война), Испания в XIX веке (например, Пиренейские войны), Великобритания XVII века (например, Войны трех королевств), Китай XX века (Гражданская война в Китае, Японо-китайская война) и Вьетнам XX века (Вьетнамская война).

Цвет плитки указывает на количество сражений для каждой страны и века. Страна отражает место проведения сражения, но необязательно воюющую сторону. Больше 100 битв (желтый цвет) приходится на страны, описанные выше. Источник: World Historical Battles Database

Всемирная база данных исторических сражений — ценный ресурс для исследователей. Такие базы позволяют гуманитарной науке опираться на количественные методы, работать с большими объемами данных, уточнять гипотезы и формулировать новые вопросы — а значит, не просто сохранять память о прошлом, но и глубже понимать его происходившие когда-то процессы.

Источник: Kitamura S. World Historical Battles Database [Электронный ресурс] // OSF. 25 January. 2022. URL: https://osf.io/j357k (дата обращения: 25.05.2025).