Точные методы в гуманитарных науках появились задолго до компьютеров — и в России их история перевалила уже за полтора века. Вспоминаем, как филологи, историки, лингвисты, математики и другие исследователи развивали количественные подходы к анализу литературы, языка и других гуманитарных объектов — и создавали базу для становления на российский почве Digital Humanities
Иллюстрация: Валя Брылова
Множество наших материалов посвящено цифровым гуманитарным наукам — Digital Humanities. А как развивалась эта область исследований в нашей стране? Разбираемся с опорой на статью Инны Кижнер, Мелиссы Террас, Бориса Орехова, Льва Мановича, Игоря Кима, Максима Румянцева и Анастасии Бонч-Осмоловской «The History and Context of the Digital Humanities in Russia» (история и контекст Digital Humanities в России).
Отец Бориса Бугаева (так на самом деле звали поэта и математика Андрея Белого) был важным лицом в Московском математическом обществе. Связь профессии отца и её влияния на сына спорна, но тем не менее Белый стал применять статистические методы к исследованию поэзии. В 1910-х годах он разработал свою методику исследования метра и ритма*, в которой сосредоточился на формальных структурных элементах произведений.
Изучение поэзии квантитативными методами продолжил Московский лингвистический кружок (1915–1924), главой которого был Роман Якобсон. Кружок состоял из шестидесяти лингвистов и литераторов. Позже из МЛК выросли лингвистические кружки в Праге, Копенгагене, Нью-Йорке и впоследствии — Международная лингвистическая ассоциация.
Следующая важная персона — Борис Ярхо, член МЛК. В 1936 году он написал «Методологию точного литературоведения», где совмещал литературу с биологией: буквально объяснял её в понятиях эволюции и рассматривал подобно живому организму. Он видел литературу как систему, элементы которой имеют определённую связь друг с другом. Сама система и эти взаимоотношения со временем меняются, а изменения можно фиксировать и анализировать. Соответственно, следует выявлять паттерны и сравнивать их, применять статистические методы и даже проводить эксперименты. Вот это и есть изучение литературы по принципам Ярхо.
Восприятие целого как совокупности частей называется редукционизмом. Такой подход критиковался и в биологии, и в случае Ярхо: как в живом организме для учёных (по крайней мере, того века) были интересны не столько сами его компоненты, сколько их взаимодействие и интеграция, так и литературное произведение — нечто большее, чем просто определённая комбинация составляющих.
После публикаций Ярхо в истории российских DH следует перерыв. Только в 1952 году математик Алексей Ляпунов проводит первый курс по программированию для студентов МГУ и в целом развивает эту область в Институте математики РАН (Сибирское отделение). Кроме информатики Ляпунов занимался машинным переводом, структурной и компьютерной лингвистикой. Также он основал журнал «Проблемы кибернетики» и Кибернетический** семинар. Благодаря ему стали популярны междисциплинарные исследования, внимание к интеграции, системный подход.
В 60-е годы на арену выходит математик Андрей Колмогоров, преподаватель МГУ. Он создаёт свой вариант изучения метра и ритма, имеющий общее с трудами Андрея Белого. Более того, он проводит «семинар по математическому стиховедению» [3].
В статье В. Б. Семёнова сказано, что именно Колмогоров сподвиг и другие области филологии становиться «точными».
Андрей Ершов был студентом и коллегой Ляпунова, а также одним из героев предыстории создания Национального корпуса русского языка (НКРЯ): Ершов заговорил о необходимости создания представительного корпуса. Так появились планы по разработке Машинного фонда русского языка.
Следующим этапом стало создание НКРЯ под руководством Владимира Плунгяна с 2001 года. В 2004 году корпус был опубликован в свободном доступе в Интернете, а в наши дни он продолжает своё развитие [4].
Также существуют несколько современных проектов, посвящённых русским классикам. Например, «Толстой Digital» и его более современный потомок — «Слово Толстого». А уже по примеру Толстого появился проект по Чехову.
В таблице из нашего источника кратко описаны ключевые моменты истории российских Digital Humanities прошлого столетия.
| Дата | Событие | Его следствия |
|---|---|---|
| 1910 | Андрей Белый публикует его статистический подход к изучению метра и ритма в поэзии (В. Б. Семёнов, «Статистические методы…») | «Ритмический кружок» для изучения метра в поэзии в ранних 1910-х (В. Б. Семёнов, «Статистические методы…») |
| 1914–1925 | Московский лингвистический кружок (1915–1924), преструктуралистские идеи, развиваемые Романом Якобсоном и Николаем Трубецким (Вяч. Вс. Иванов, «Из истории…»; Н. С. Трубецкой «Письма и заметки») | Пражский лингвистический кружок (1926–1953); Лингвистический кружок Копенгагена (создан в 1931 г.); Лингвистический кружок Нью-Йорка (1943–1969), ныне — Международная лингвистическая ассоциация |
| 1936 | Борис Ярхо завершает «Методологию точного литературоведения» в сибирской ссылке | |
| 1952 | Математик Алексей Ляпунов проводит первый в России курс по информатике для студентов МГУ | Ляпунов инициирует создание рабочей группы по машинному переводу в Институте прикладной математики им. М. В. Келдыша РАН в 1954 г. и Секторе структурной лингвистики и машинного перевода в Институте языкознания РАН в 1960 г. Следующий шаг — создание Отделения лингвистики с сильным вычислительным компонентом в МГУ в 1960 (О. С. Кулагина, «Алексей Ляпунов»; Б. А. Успенский, «К проблеме генезиса тартуско-московской семиотической школы»). |
| 1954–1973 | Алексей Ляпунов учреждает журнал «Проблемы кибернетики» и Кибернетический семинар на механико-математическом факультете МГУ | Традиции междисциплинарных исследований, интегративного мышления и системных подходов развиваются в разных институциях страны (Д. А. Поспелов, «Становление информатики в России») |
| 1960-е | Математик Андрей Колмогоров публикует статьи по изучению метра и ритма в поэзии, связанные с трудами Андрея Белого (В. Б. Семёнов, «Статистические методы…») | Лекции и дискуссии в МГУ, Московском математическом обществе, диспуты на Математическом конгрессе в 1961 и междисциплинарные конференции в 1961 и 1963 (Б. А. Успенский, «К проблеме генезиса тартуско-московской семиотической школы») |
| 1977 | Андрей Ершов, коллега и студент Ляпунова, говорит о необходимости создания машинного фонда русского языка на конференции по обработке естественного языка в 1978 году в Пущино рядом с Москвой (И. А. Крайнева и Н. А. Черемных, «Путь программиста») | Создаётся отделение Машинного фонда русского языка в Институте русского языка РАН в 1986 году (И. А. Крайнева и Н. А. Черемных, «Путь программиста») |
| 2000–2004 | Национальный корпус русского языка | Владимир Плунгян создаёт рабочую группу из разных лингвистов и институций для разработки НКРЯ в 2001 году (Д. В. Сичинава, «Национальный корпус русского языка…») |
И в конце, когда мы рассмотрели историю, можно поговорить об особенностях русских DH и их отличиях от мировых.
В начале XX века изучение метра и ритма стихотворений было популярно не только у нас, но и за рубежом. В целом, применять квантитативные методы к изучению литературы было мировой практикой.
Кроме того набирала обороты оцифровка материалов. Появлялись языковые корпусы, развивался машинный перевод текстов.
При этом в нашей стране больше уделяли внимания моделированию процессов, а не моделям данных и их классификации.
Кроме того цифровые гумантитарные науки в России больше завязаны на математику и биологию, чем на антропологию и социологию. По сути эта особенность и является вкладом российской цифровой гуманитаристики в развитие мировых DH: она демонстрирует альтернативный подход (биология + системность + гуманитарные науки) и его плодотворность.
Итак, что мы узнали из статьи Инны Кижнер, Бориса Орехова, Мелиссы Террас, Льва Мановича, Игоря Кима, Максима Румянцева и Анастасии Бонч-Осмоловской о развитии Digital Humanitites в России:
Источники в таблице:
*По терминологии Белого, метр — порядок (идеальный), а ритм — отступления от него, то есть фактический порядок [3].
**Кибернетика — наука, изучающая информационные процессы в сложных системах: машинах, живых организмах и обществе.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…