Республика учёных

Начиная с 15 века благодаря открытию новых университетов, изобретению печати, развитию почтовой системы всё больше и больше образованных людей из разных стран могли связываться друг с другом, чтобы обсудить новые публикации, события или частную жизнь.

Таким образом, европейское научное сообщество оказалось неформально, но очень тесно связано. Сами себя члены этого огромного надгосударственного и независимого общества назвали respublica litteraria — республика учёных. Стать её частью можно было вне зависимости от происхождения или дохода, нужно было просто быть образованным и культурным человеком.

Самым важным и обширным свидетельством о существовании «республики» является корреспонденция, связывавшая воедино людей из разных концов мира. По приблизительным оценкам, с того времени до нас дошло более миллиона писем.

Кроме того, сохранились различные сведения о путешествиях, религиозных обществах и университетах, а также книги, газеты и журналы.

Предыстория изучения

Долгое время письма хранились в архивах, и ученым нужно было приложить усилия, чтобы получить к ним доступ.

В наши дни ситуация немного улучшилась: очень много документов оцифровано и находится в открытом доступе. Нехватки источников уже давно нет, напротив, обилие информации делает невозможным всё проанализировать и составить общую картину происходящего. И здесь на помощь человеку приходит Big Data.

Шаг 1. Поиск источников

Итак, тысячи писем сохранились до наших дней, но они могут быть разбросаны по всему миру. Какие-то из них можно найти в государственных архивах, другие — в семейных и частных коллекциях, третьи — в библиотеках.

Удобнее всего, когда каталог писем оцифрован и находится в открытом доступе. Но зачастую учёным приходится работать с отдельными рукописными письмами.

Для того, чтобы ускорить процесс сбора информации, используется автоматизация. Важным прорывом в этой области стала разработка программы, которая может распознавать рукописный текст. Например, существует приложение Transkribus, которое на основании размеченных вручную текстов может автоматически анализировать остальной корпус конкретного автора.

Шаг 2. Исправление и внесение данных

В первую очередь для исследований такого рода нужна метаданные — информация об информации. В данном случае это все сведения о письме: от кого и кому, откуда и куда, — которые затем собираются в единую базу данных. Но прежде чем это сделать, нужно проверить правильность информации и привести её к единому формату, доступному для компьютерного анализа.

Например, один и тот же человек может фигурировать под разными именами (светские и религиозные титулы, псевдонимы) и, напротив, одинаковые имена могут быть у разных людей. Чтобы избежать повторений, каждому человеку в системе был присвоен ID, к которому были привязаны все относящиеся к нему имена.

Также иногда бывает неочевидно, кто автор той или иной рукописи. В таких случаях применяется стилометрия — определение авторства по характерным особенностям стиля.

В результате были созданы просопографии — коллекции биографических сведений. В данном случае они содержат не просто нарративное описание жизни, а данные, адаптированные для компьютерного анализа.

Не всегда у письма сохраняется точная дата отправления, зачастую она может отсутствовать или быть нечётко определена. Для таких случаев приходится вводить отрезок времени с крайними возможными датами, что усложняет задачу, ведь компьютер оперирует датами в формате день-месяц-год.

С пространством тоже возникают сложности. Во-первых, у мест, как и у людей, может быть несколько разных наименований. Во-вторых, имея дело с конкретными географическими объектами, нужно всегда учитывать более широкий контекст: к какой стране это место принадлежало в тот период, по какому календарю там жили люди.

Подробную и проверенную информацию о населённых пунктах берут из специальных географических справочников, таких как GeoNames или Early Modern Places.

Когда производится работа над письмом, приходится учитывать, является ли конкретно взятый документ черновиком, копией или тем самым посланным вариантом.

С учётом совокупности требуемых функций и на основе уже существующих приложений была создана платформа Palladio.

Шаг 3. Обработка данных

С 1960-х появилась идея применять компьютерный анализ количественных данных в гуманитарных исследованиях.

Одним из развивающихся направлений стала обработка естественного языка.
Для примера возьмём корреспонденцию Яна Коменского — чешского общественного и религиозного деятеля 17 века. Можно ли найти различия в том, как и о чём он писал, в зависимости от того, кому его письма были адресованы?

Было выбрано 3 группы адресатов: реформаторы образования в Германии (GER), кружок в Данциге (DC) и кружок Сэмюэля Хартлиба (HC).
Программа ReaderBench позволила получить следующую информацию.

Изучив полученные результаты, представленные на графиках, учёные отметили, как сильно отличаются письма к кружку Хартлиба от двух других групп. Они были длиннее, количество используемых слов было больше, а также в них содержалось больше смысловых связок.

Шаг 4. Создание сети

С 1990-х возникла идея о том, что сети могут быть применены в различных сферах, в том числе сети стали широко использоваться для реконструкции исторических ситуаций.

В нашем случае самая простая сеть — визуализация переписки одного человека.
Адамантиос Кораис (1777-1833) — греческий учёный-просветитель Нового времени. Он считал себя гражданином мира, не привязанным к какой-либо конкретной стране. Чтобы проверить, так ли это было в действительности, было решено проанализировать его переписку.

Он писал людям из 66 городов, из которых 41 находится в Европе, 3 в Америке и 22 в Греции. Аналогичная ситуация наблюдается и среди полученных писем: 50 из Греции и 39 из других стран. Как стало видно после визуализации, на его общение действительно мало влияли географические и социальные границы.

Но сети могут применяться и для больших сообществ.

Одна из рабочих групп занималась сетями двух католических орденов — иезуитов и бенедиктинцев. Для сравнения было взято два параметра: откуда происходили члены соответствующих орденов (оранжевые точки) и где располагались центры, к которым они принадлежали (голубые точки).

Глядя на карты, мы видим, что более консервативные бенедиктинцы, унаследовавшие из Средних веков традицию децентрализованного сохранения знания, были гораздо сильнее ограничены пространственными рамками. Если человек родился во Франции, то и в орден он вступит скорее всего там же. Напротив, иезуиты, чьи миссионерские цели распространялись на весь мир, не были так сильно привязаны к конкретным местам.

Таким образом, использование сетей в исторических исследованиях позволяет рассматривать конкретный случай в более широком контексте и находить новые подходы к уже известным темам.

Шаг 5. Визуализация и изучение данных

70% информации мы получаем через зрение, поэтому было важно не только получить количественные данные, но и представить их в удобной для исследователей форме.
В книге ‘Reassembling the Republic of Letters in the Digital Age’, где подводятся итоги проделанной работы, упоминаются следующие программы для визуализации и анализа: Gephi, NodeGoat, AntConc, TaPOR, TXM, Voyant, Palladio, ReaderBench, а также языки программирования Python и R.

Например, одна группа исследователей занималась перепиской Эразма Роттердамского. Поскольку объём его корреспонденции и места адресатов сильно менялись с течением времени, недостаточно было просто нанести адреса на карту, нужно было вводить иные параметры. Для этого были использованы форма (кругами обозначены отправленные письма, а треугольниками — полученные) и цвет (красным цветом обозначены последние письма (1518), оранжевым — относящиеся к периоду 1514-1517, а жёлтым — между 1508 и 1513).

Таким образом, можно заметить, что, например, за выбранный период Эразм Роттердамский стал меньше переписываться с Базелем и Антверпеном, но больше с Парижем и Лёвеном, тогда как объём корреспонденции с Лондоном остался прежним. Также видно, что в более ранний период было больше писем адресованных Эразму Роттердамскому, а в более поздний — наоборот, им отправленных.

Помимо переписки, можно исследовать и другие аспекты жизни. Проще всего найти информацию по университетам, так как европейское образование было хорошо задокументировано и стандартизовано (везде примерно одни и те же направления и ступени обучения).

Для изучения была взята Скандинавия, где, как было известно, поездки студентов за границу поощрялись правительством. Как и предполагалось изначально, большой популярностью пользовались протестантские страны, а также такие крупные центры, как Париж и Лондон. Но гораздо менее очевидно, куда НЕ ездили студенты. И тут на помощь приходит компьютерный анализ.

Согласно полученной карте, к местам, которых скандинавы избегали, относятся Испания, Португалия, вся Франция (кроме Парижа), юг Италии и восточная часть центральной Европы за исключением Вены.

Собранная информация позволила также предположить, почему это могло произойти. Помимо очевидного влияния религии, было определено, что немаловажную роль играла и традиция: во внимание принималось образование отцов студентов.

Помимо построения статической картинки, компьютерный анализ облегчает понимание того, как изменялась тенденция со временем: к концу 18 века получать образование за границей жители Скандинавии стали значительно реже, тогда как национальные университеты стали пользоваться большим спросом.

Одна из самых сложных тем для исследования связана с женщинами, поскольку они не принадлежали к таким чётко структурированным общественным институтам, как, например, университеты или политические группировки.

Сведения об именах, местах проживания, годах жизни имеются как для мужчин, так и для женщин. Но гораздо сложнее собрать более специализированную информацию. Исследователи предлагают обратить внимание на такие детали, как рождение детей, частное образование, грамотность, прочитанные книги и т. д.

Итог

Этот проект по исследованию республики учёных был начат в Стэнфордском университете в 2013 году. В него вовлечены учёные из разных стран.

Подобный проект позволяет по-новому взглянуть на историю через призму культурных зон, которые, как подтвердило исследование, имели зыбкие границы и зачастую пересекались.

В самой глобальной перспективе, как пишут его создатели, такой проект может помочь понять истоки космополитизма, глобальных связей и сделать акцент на общеевропейском наследии.

Источники