Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа

Что такое DH?

Digital Humanities (DH) — это направление исследований, предполагающее использование цифровых методов для приобретения новых знаний в гуманитарной сфере.

Внутри DH можно выделить такие дисциплины, как цифровая филология, цифровая история или цифровое востоковедение, однако при этом DH остается единым направлением, объединенным общностью цифровых методов.

Инструменты DH исследований

Инструментарий DH исследований зависит от его целей: где-то используются количественные методы, где-то суммаризация и визуализация. Ниже мы приведем примеры инструментов, с помощью которых можно проводить DH-исследования, кратко их опишем, а также дадим ссылки на гайды «Системного Блока».

Подготовка текстовых данных к исследованию

Предобработка

Для того, чтобы исследование вышло грамотным и красивым, нужно подготовить для него данные. Предобработка может сильно отличаться в зависимости от вида и состояния данных. Если это текст и его нужно распознать, пригодится гайд по optical character recognition (OCR) и статья о платформе для оцифровки Transkribus; если собрать тексты в корпус – подойдет один из гайдов по инструменту Voyant Tools.

А для исследований по цифровому востоковедению пригодятся гайды по токенизации китайского, корейского и японского с помощью Python-библиотек.

Статистический анализ текста для установления авторства

Стилометрия

Стилометрия — это статистический анализ для атрибуции текста. Подробнее о том, что это такое, можно прочесть в этом материале, а гайд по проведению собственного стилометрического эксперимента с помощью библиотеки языка R stylo находится здесь. Для тех, кто уже разобрался с базой, есть продвинутый гайд, а также обзор на функцию oppose().

Выявление связей между объектами с помощью графов

Сетевой анализ

В рамках сетевого анализа данные представляются в виде графа, благодаря чему можно обнаружить неочевидные связи между изучаемыми элементами. Подробнее об истории сетевого анализа и о том, как «сплести» сеть самостоятельно — в гайде по инструменту Gephi. А после этого можно добавить красок, пользуясь вторым гайдом по нескучной визуализации в Gephi.

Исследование больших массивов текстов с помощью корпуса

Корпусный анализ

Для DH характерна работа с большими данными, часто — с корпусами. О том, как собрать, разметить и хранить ваш корпус, — в этом гайде. Также предлагаем гайд по уже упоминавшемуся Voyant tools и дополнение к нему о том, как исследовать японские тексты.
Еще один инструмент, достойный внимания, — Sketch Engine, гайд по нему существует в двух частях: вот первая и вот вторая.

Выявление тем и смысловых кластеров в больших корпусах текстов

Тематическое моделирование

Как понять, о чем тексты, не читая их? Тематическое моделирование дает отличную возможность сделать предварительные выводы о содержании больших коллекций (корпусов) текстов. Представляем вашему вниманию основной гайд, гайд с подзаголовком «без боли и командной строки» и еще один.

Автоматическое выделение в тексте людей, мест и организаций

Анализ именованных сущностей

О тексте можно узнать много интересного, выделяя в нем упоминания людей, мест, организаций и других важных деталей. О распознавании именованных сущностей на примере исторических дневников — в этом гайде.

Также можно заглянуть в гайд по анализу тональности (сентимент-анализу).

Анализ смысловой близости слов по их контекстам

Векторные семантические модели

Насколько слова похожи друг на друга с точки зрения контекстов, в которых они встречаются? На этот вопрос можно ответить с помощью векторных представлений слов. Здесь можно разобраться в том, как это работает, а с этим гайдом — научиться работать с Word2vec самостоятельно.

Структурированная разметка текстов и метаданных в формате TEI

Кодирование TEI

Формат кодирования текстов, позволяющий хранить данные в удобном виде и добавлять к ним метаданные. Об истории и принципах работы TEI можно почитать здесь.

Цифровые издания литературных текстов с расширенными возможностями поиска и анализа

Создание семантических изданий

Оцифрованные тексты — это здорово, но на этом возможности взаимодействия литературного наследия с цифровой средой не заканчиваются. О цифровых проектах, посвященных творчеству и жизни Толстого, можно узнать здесь, о семантическом (то есть цифровом с возможностью поиска) издании Чехова — здесь, а о цифровом Пушкине —здесь. Также существует сайт о Достоевском, который СБъ еще предстоит осветить.

Конечно же, этот список не исчерпывающий и очень быстро пополняется. Пока что за кадром осталось, например, 3D-моделирование и использование GIS-технологий.

Глоссарий DH

Named Entity Recognition (NER) — выделение в тексте имен собственных и их последующая классификация.
TF-IDF — показатель «важности» слова для текста, используемый при поиске, классификации и кластеризации текстов.
Визуализация данных — о том, как представлять данные так, чтобы становилось понятнее и полезнее.
Дальнее чтение — исследование текстов «издалека», то есть попытка вычленить закономерности в тысячах текстов.
Дельта Бёрроуза — мера стилистической близости между текстами.
Лемматизация— приведение слов к базовой форме, чтобы упростить работу с текстом.
Сетевой анализ — способ исследования и визуализации связей между объектами: людьми, персонажами, животными или чем угодно еще.
Регулярные выражения — инструмент для поиска похожих частей в тексте по заданному шаблону.
Эго-документ — исторический источник личного происхождения: например, дневник, мемуары, письма или открытки.

Эксперты

Digital Humanities в лицах: знакомимся с ведущими русскоговорящими экспертами в этой области!

А ещё они порекомендовали «Системному Блоку» по паре книг для тех, кто только начал разбираться, что же такое Digital Humanities.

Ольга Алиева

Доцент Школы философии НИУ ВШЭ

Автор исследований на стыке классической филологии и цифровых методов

Книжная рекомендация

Для начала вот это самое полезное, что есть на русском языке:

Цифровые гуманитарные исследования: монография / А.Б. Антопольский, А.А. Бонч-Осмоловская, Л.И. Бородкин [и др.]. Красноярск: СФУ, 2023. (полный текст) [Наше примечание: эту книгу порекомендует еще не один эксперт, поэтому «см. выше» будет отсылать сюда!]

Вот это фундаментальная работа, но тут более узкий фокус, только дальнее чтение. Зато прекрасный перевод и введение:

Моретти, Ф. Дальнее чтение [Текст] / пер. с англ. А. Вдовина, О. Собчука, А. Шели. Науч. ред. перевода И. Кушнарева. — М.: Изд-во Института Гайдара, 2016.

Анастасия Бонч-Осмоловская

Ведущая научная сотрудница ИРЯ РАН, директор образовательных программ в CultTech Association, соосновательница DH CLOUD Community

Специалистка по компьютерным методам в лингвистике и филологии

Андрей Володин

Доцент кафедры исторической информатики МГУ, руководитель стратегического проекта «Институт цифровых гуманитарных исследований» СФУ

Специалист по применению компьютерных технологий в исторических исследованиях и анализу исторических данных

Книжная рекомендация

Если говорить о вводных книгах, то думаю, что можно предложить:

Цифровые гуманитарные исследования: монография. Красноярск: СФУ, 2023 (см. выше)

Drucker, J. The Digital Humanities Coursebook. An Introduction to Digital Methods for Research and Scholarship. Routledge, 2021 (ссылка)

Динара Гагарина

Научная сотрудница Университета Эрлангена – Нюрнберга, соосновательница DH CLOUD Community

Специалистка в области цифровой истории

Инна Кижнер

Университет Хайфы, Израиль

Специалистка по цифровому культурному наследию

Книжная рекомендация

Brughmans, T., Collar, A., & Coward, F. (Eds.). The Oxford Handbook of Archaeological Network Research. Oxford University Press, 2023. (ссылка)

Александр Климов

Руководитель программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ

Специалист по точным методам в лингвистике и филологии

Книжная рекомендация

На русском языке все ещё нет ничего лучше монографии о Цифровых гуманитарных исследованиях (см. выше), потому что она дает широкую панораму и очень хорошо пояснит, что вообще происходит, тем, кому интересно посмотреть.

Если Вам интересно посмотреть на то, как, например, современная филология/история меняется под влиянием корпусов и репрезентативных выборок, из самого свежего надо читать «Загадку народа-сфинкса» нашего вышкинского филолога Алексея Владимировича Вдовина.

Если Вы владеете английским и хотите уйти чуть дальше от узкого понимания гуманитарного, но при этом интересуется «россиеведением», то Вам точно подойдет Zaidi, N., & Pue, A. S. Exploring Digital Humanities in India: Pedagogies, Practices, and Paradigms. Springer, 2020 (ссылка). Здесь и ГИСы, и политические, демографические, филологические etc. штудии.

Полина Колозариди

Директор DH-Центра ИТМО

Авторка исследований на стыке социальной антропологии и философии техники

Книжная рекомендация от DH-Центра ИТМО

Alvarado, R. C. (2012). The digital humanities situation. Debates in the digital humanities, 50-55. (ссылка)

Brügger, N. (2016). Digital Humanities in the 21st Century: Digital Material as a Driving Force. DHQ: Digital Humanities Quarterly, 10(3). (ссылка)

Кирилл Маслинский

Руководитель Лаборатории цифровых исследований литературы и фольклора ИРЛИ РАН

Цифровой филолог, автор исследований по детской литературе, антропологии образования и русскому фольклору

Книжная рекомендация

Paige, N. Technologies of the Novel: Quantitative Data and the Evolution of Literary Systems. Cambridge University Press, 2021 (ссылка)

Это отличная книга для того, чтобы, не погружаясь в технические детали, начать думать о механизмах эволюции такой сложной литературной формы, как роман. Количественное исследование очень сложного феномена совсем без сложной статистики. Автор выделяет специфические литературные приемы («технологии») и прослеживает их употребление в корпусе романов по отдельности. Образец прекрасного дизайна корпусного исследования.

Calvo Tello, J. The Novel in the Spanish Silver Age: A Digital Analysis. Transcript Verlag, 2021 (ссылка)

Что такое жанр? И поджанр? И жанровая форма? В количественных исследованиях всегда есть большой соблазн упростить ответ, например, взяв какой-нибудь удобный список жанровых меток и забыв о проблеме. Хосе Кальво Телло операционализует проблему жанра осознанно и разными способами. Это позволяет ему, не закрывая глаза на методологические трудности, выйти к большим теоретическим вопросам.

Борис Орехов

Доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН (Пушкинский Дом), сооснователь DH CLOUD Community

Специалист по многим областям Digital Humanities, в частности, цифровой филологии, стиховедению, а также по компьютерным методам в лингвистике и применению искусственного интеллекта в гуманитарных науках

Книжная рекомендация

Цифровые гуманитарные исследования: монография (см. выше)

Орехов Б. В. Башкирский стих XX века. Корпусное исследование / Б. В. Орехов. — СПб.: Алетейя, 2019 (ссылка)

Даниил Скоринкин

Координатор направления Digital Humanities в Потсдамском университете, основатель и главный редактор «Системного Блока»

Специалист по цифровой филологии и корпусной лингвистике

Книжная рекомендация

Bod, R. A New History of the Humanities: The Search for Principles and Patterns from Antiquity to the Present. Oxford University Press, 2013 (ссылка)

Полный список рекомендованных книг

Alvarado, R. C. (2012). The digital humanities situation. Debates in the digital humanities, 50-55. (ссылка)

Bod, R. A New History of the Humanities: The Search for Principles and Patterns from Antiquity to the Present. Oxford University Press, 2013 (ссылка)

Brügger, N. (2016). Digital Humanities in the 21st Century: Digital Material as a Driving Force. DHQ: Digital Humanities Quarterly, 10(3). (ссылка)

Brughmans, T., Collar, A., & Coward, F. (Eds.). The Oxford Handbook of Archaeological Network Research. Oxford University Press, 2023. (ссылка)

Calvo Tello, J. The Novel in the Spanish Silver Age: A Digital Analysis. Transcript Verlag, 2021 (ссылка)

Drucker, J. The Digital Humanities Coursebook. An Introduction to Digital Methods for Research and Scholarship. Routledge, 2021 (ссылка)

Paige, N. Technologies of the Novel: Quantitative Data and the Evolution of Literary Systems. Cambridge University Press, 2021 (ссылка)

Zaidi, N., & Pue, A. S. Exploring Digital Humanities in India: Pedagogies, Practices, and Paradigms. Springer, 2020 (ссылка)

Вдовин А. В. Загадка народа-сфинкса. НЛО, 2024 (ссылка)

Орехов Б. В. Башкирский стих XX века. Корпусное исследование / Б. В. Орехов. — СПб.: Алетейя, 2019 (ссылка)

Цифровые гуманитарные исследования: монография / А.Б. Антопольский, А.А. Бонч-Осмоловская, Л.И. Бородкин [и др.]. Красноярск: СФУ, 2023. (полный текст)

Скачать .bib файл по ссылке.

Блоги

А за кем можно регулярно следить, чтобы узнать о DH больше? Например, за экспертами, ведущими блоги для «Системного Блока»! Комментарии о текущих событиях, размышления о гуманитарных науках в цифровом мире и другой интересный контент — по ссылкам ниже.

Где учат

Представляем подборку образовательных программ в российских и зарубежных вузах, где можно обучаться DH.

Зарубежные программы

Linguistic Diversity and Digital Humanities, University of Helsinki, Helsinki, Finland
Learning, Digitalization, and Sustainability, Jönköping University, Jönköping, Sweden
Digital Humanities, Linnaeus University, Växjö, Sweden
Humanidades Digitales, Universitat Politècnica de València (UPV), Valencia, Spain
Digital Humanities, Universitat de Barcelona, Barcelona, Spain
Digital and Public Humanities, Ca’ Foscari University of Venice, Venice, Italy
Digital Humanities and Digital Knowledge (DHDK), University of Bologna, Bologna, Italy
Human-centered Artificial Intelligence, University of Pavia, Pavia, Italy
Communication & Information Studies: Digital Humanities, University of Groningen, Groningen, Netherlands
Digital Humanities, King’s College London — Faculty of Arts & Humanities, London, United Kingdom
Digital Pedagogy, University of the Highlands and Islands, Daliburgh, United Kingdom
Digital Humanities, KU Leuven, Leuven, Belgium
Digital Humanities, University of Lausanne Faculty of Theology and Religious Studies, Lausanne, Switzerland
Digital Humanities, Tecnológico de Monterrey — ITESM, Monterrey, Mexico
Center for Digital Humanities, Research Institute of Korean Studies (RIKS), Seoul, South Korea
Interdisciplinary Digital Literary Studies Program, Chungnam National University, Daejeon, South Korea
DH-центр Уханьского университета («武汉大学数字人文研究中心»)
DH-центр Тайваньского университета («台湾大学数位人文研究中心»)
DH-центр Пекинского университета («北京大学数字人学实验室»）
DH-центр Нанкинского университета («南京大学高研院数字人文创研中心»)
DH-центр Университета Цинхуа («清华大学数字人文»)
International Institute for Digital Humanities, Tokyo, Japan
Digital Humanities Center for Japanese Arts and Cultures (DH-JAC), Ritsumeikan University, Kyoto, Japan

Зарубежные журналы

DH также существует в рамках академической среды, соответственно, есть огромное количество журналов, в которых публикуются исследования, эссе, обзоры, результаты экспериментов, которые так или иначе связаны с цифровыми методами в гуманитарных науках. Предлагаем вам ознакомиться с нашей подборкой журналов про DH на любой вкус:

Journal of Computational Literary Studies (JCLS)

Журнал посвящен цифровым исследованиям в области литературоведения: в нем публикуются статьи, авторы которых анализируют художественные тексты и их контексты с помощью цифровых методов.

Центральная тема журнала — цифровые методы в медиевистике, здесь можно найти оригинальные научные исследования, теоретические статьи о цифровых методах, заметки, комментарии, посвященные достижениям в области цифровой медиевистики, библиографические и обзорные статьи, учебные пособия и отчеты о проектах.

Авторы: Евгения Колпащикова, Валерия Мелкозерова, Марина Севостьянова и другие участники «Системного Блока».

Что такое DH?

Инструменты DH исследований

Предобработка

Стилометрия

Сетевой анализ

Корпусный анализ

Тематическое моделирование

Анализ именованных сущностей

Векторные семантические модели

Кодирование TEI

Создание семантических изданий

Глоссарий DH

Эксперты

Полный список рекомендованных книг

Блоги

Где учат

Цифровые методы в гуманитарных науках в целом

Лингвистика

Культура и искусство

История

Зарубежные программы

Зарубежные журналы

Последние статьи по теме

Что такое capta и чем отличается от больших данных?

UX в(c) DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой

А автор кто? Рассудит дельта Бёрроуза

О проекте

Контакты

СОЦСЕТИ

Теги

Темы