Что такое DH?
Digital Humanities (DH) — это направление исследований, предполагающее использование цифровых методов для приобретения новых знаний в гуманитарной сфере.
Внутри DH можно выделить такие дисциплины, как цифровая филология, цифровая история или цифровое востоковедение, однако при этом DH остается единым направлением, объединенным общностью цифровых методов.
Инструменты DH исследований
Инструментарий DH исследований зависит от его целей: где-то используются количественные методы, где-то суммаризация и визуализация. Ниже мы приведем примеры инструментов, с помощью которых можно проводить DH-исследования, кратко их опишем, а также дадим ссылки на гайды «Системного Блока».
Предобработка
Для того, чтобы исследование вышло грамотным и красивым, нужно подготовить для него данные. Предобработка может сильно отличаться в зависимости от вида и состояния данных. Если это текст и его нужно распознать, пригодится гайд по optical character recognition (OCR) и статья о платформе для оцифровки Transkribus; если собрать тексты в корпус – подойдет один из гайдов по инструменту Voyant Tools.
А для исследований по цифровому востоковедению пригодятся гайды по токенизации китайского, корейского и японского с помощью Python-библиотек.
Стилометрия
Стилометрия — это статистический анализ для атрибуции текста. Подробнее о том, что это такое, можно прочесть в этом материале, а гайд по проведению собственного стилометрического эксперимента с помощью библиотеки языка R stylo находится здесь. Для тех, кто уже разобрался с базой, есть продвинутый гайд, а также обзор на функцию oppose().
Сетевой анализ
В рамках сетевого анализа данные представляются в виде графа, благодаря чему можно обнаружить неочевидные связи между изучаемыми элементами. Подробнее об истории сетевого анализа и о том, как «сплести» сеть самостоятельно — в гайде по инструменту Gephi. А после этого можно добавить красок, пользуясь вторым гайдом по нескучной визуализации в Gephi.
Корпусный анализ
Для DH характерна работа с большими данными, часто — с корпусами. О том, как собрать, разметить и хранить ваш корпус, — в этом гайде. Также предлагаем гайд по уже упоминавшемуся Voyant tools и дополнение к нему о том, как исследовать японские тексты.
Еще один инструмент, достойный внимания, — Sketch Engine, гайд по нему существует в двух частях: вот первая и вот вторая.
Тематическое моделирование
Как понять, о чем тексты, не читая их? Тематическое моделирование дает отличную возможность сделать предварительные выводы о содержании больших коллекций (корпусов) текстов. Представляем вашему вниманию основной гайд, гайд с подзаголовком «без боли и командной строки» и еще один.
Анализ именованных сущностей
О тексте можно узнать много интересного, выделяя в нем упоминания людей, мест, организаций и других важных деталей. О распознавании именованных сущностей на примере исторических дневников — в этом гайде.
Векторные семантические модели
Насколько слова похожи друг на друга с точки зрения контекстов, в которых они встречаются? На этот вопрос можно ответить с помощью векторных представлений слов. Здесь можно разобраться в том, как это работает, а с этим гайдом — научиться работать с Word2vec самостоятельно.
Кодирование TEI
Формат кодирования текстов, позволяющий хранить данные в удобном виде и добавлять к ним метаданные. Об истории и принципах работы TEI можно почитать здесь.
Создание семантических изданий
Оцифрованные тексты — это здорово, но на этом возможности взаимодействия литературного наследия с цифровой средой не заканчиваются. О цифровых проектах, посвященных творчеству и жизни Толстого, можно узнать здесь, а о семантическом (то есть цифровом с возможностью поиска) издании Чехова — здесь. Также существуют похожие проекты о Пушкине и Достоевском, которые СБъ еще предстоит осветить.
Конечно же, этот список не исчерпывающий и очень быстро пополняется. Пока что за кадром осталось, например, 3D-моделирование и использование GIS-технологий.
Глоссарий DH
- Named Entity Recognition (NER) — выделение в тексте имен собственных и их последующая классификация.
- TF-IDF — показатель «важности» слова для текста, используемый при поиске, классификации и кластеризации текстов.
- Визуализация данных — о том, как представлять данные так, чтобы становилось понятнее и полезнее.
- Дальнее чтение — исследование текстов «издалека», то есть попытка вычленить закономерности в тысячах текстов.
- Дельта Бёрроуза — мера стилистической близости между текстами.
- Лемматизация— приведение слов к базовой форме, чтобы упростить работу с текстом.
- Сетевой анализ — способ исследования и визуализации связей между объектами: людьми, персонажами, животными или чем угодно еще.
- Регулярные выражения — инструмент для поиска похожих частей в тексте по заданному шаблону.
- Эго-документ — исторический источник личного происхождения: например, дневник, мемуары, письма или открытки.
Блоги
За кем можно следить, чтобы узнать о DH больше? Например, за экспертами, ведущими блоги для «Системного Блока»! Комментарии о текущих событиях, размышления о гуманитарных науках в цифровом мире и другой интересный контент — по ссылкам ниже.
- Блог Бориса Орехова
- Блог Анастасии Бонч-Осмоловской
- Блог Даниила Скоринкина
- Блог DH-Центра ИТМО
- Блог Артема Шели
Эксперты
Digital Humanities в лицах: знакомимся с ведущими русскоговорящими экспертами в этой области!
Доцент Школы философии НИУ ВШЭ
Автор исследований на стыке классической филологии и цифровых методов
Доцент кафедры исторической информатики МГУ, руководитель стратегического проекта «Институт цифровых гуманитарных исследований» СФУ
Специалист по применению компьютерных технологий в исторических исследованиях и анализу исторических данных
Научная сотрудница Университета Эрлангена – Нюрнберга, соосновательница DH CLOUD Community
Специалистка в области цифровой истории
Интервью для «Системного Блока»
Руководитель программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ
Специалист по точным методам в лингвистике и филологии
Инна Кижнер
Университет Хайфы, Израиль
Специалистка по цифровому культурному наследию
Интервью для «Системного Блока»
Директор DH-Центра ИТМО
Авторка исследований на стыке социальной антропологии и философии техники
Интервью для «Системного Блока»
Руководитель Лаборатории цифровых исследований литературы и фольклора ИРЛИ РАН
Цифровой филолог, автор исследований по детской литературе, антропологии образования и русскому фольклору
Интервью для «Системного Блока»
Доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН (Пушкинский Дом), сооснователь DH CLOUD Community
Специалист по многим областям Digital Humanities, в частности, цифровой филологии, стиховедению, а также по компьютерным методам в лингвистике и применению искусственного интеллекта в гуманитарных науках
Интервью для «Системного Блока»
Координатор направления Digital Humanities в Потсдамском университете, основатель и главный редактор «Системного Блока»
Специалист по цифровой филологии и корпусной лингвистике
Где учат
Представляем подборку образовательных программ в российских и зарубежных вузах, где можно обучаться DH.
Цифровые методы в гуманитарных науках в целом
- «Цифровые методы в гуманитарных науках», НИУ ВШЭ, Москва
- «Интеллектуальные технологии и анализ данных в гуманитарной сфере», РУДН, Москва
- «Цифровые методы в гуманитарных исследованиях», ИТМО, Санкт-Петербург
- «Прикладной анализ данных (ПАНДАН)» ЕУСПб, Санкт-Петербург
- «Магистратуры Digital Humanities», НИ ТГУ, Томск
- «Цифровые технологии в филологии, компьютерная лингвистика», ЮФУ, Ростов-на-Дону
- «Цифровая гуманитаристика», УрФУ им. Б.Н. Ельцина, Екатеринбург
Лингвистика
- «Компьютерная лингвистика», НИУ ВШЭ, Москва
- «Языковые технологии в бизнесе и образовании», НИУ ВШЭ, Санкт-Петербург
- «Цифровое германское лингволитературоведение», РГГУ, Москва
- «Фундаментальная и компьютерная лингвистика», РГГУ, Москва
- «Цифровые инновации в филологии», РУДН, Москва
- «Когнитивная и цифровая лингвистика (цифровая магистратура)», РУДН, Москва
- «Цифровые технологии в лингвистических проектах (с дополнительной квалификацией «Педагог дополнительного образования»)», СПбГУ, Санкт-Петербург
- «Искусственный интеллект в моделировании речевой деятельности», СПбГУ, Санкт-Петербург
- «Цифровые технологии и иностранные языки», СПбПУ, Санкт-Петербург
- «Прикладная лингвистика и текстовая аналитика / Applied Linguistic and Text Analytics», НИУ ВШЭ, Нижний Новгород
- «Компьютерная и когнитивная лингвистика / Computational and Cognitive Linguistics», НИ ТГУ, Томск
- «Обработка естественного языка (NLP) в лингвистике и IT / Natural Language Processing in linguistics and IT (совместно со Skillfactory)», НИ ТГУ, Томск
- «Цифровая лингвистика и лингводидактика», СКФУ, Ставрополь
Культура и искусство
- «Цифровые технологии в культуре», МГУ имени М.В. Ломоносова, Москва
- «Цифровые технологии в культуре и образовании», МИП, Москва
- «Музей в цифровую эпоху: традиции и инновации», РГГУ, Москва
- «Управление документами и данными в цифровом государственном управлении», РГГУ, Москва
- «Арт-инжиниринг и медиаискусство», СПбПУ, Санкт-Петербург
- «Digital Past: Курирование цифрового наследия», НИ ТГУ, Томск
- «Цифровые технологии в управлении документацией», ТГУ им. Г. Р. Державина, Тамбов
История
- «Искусственный интеллект и цифровая история», КФУ, Казань
- «Виртуальная археология», СФУ, Красноярск
- «Историческая информатика», МГУ имени М.В. Ломоносова, Москва
- «Цифровая история», УрФУ, Екатеринбург
Зарубежные программы
- Linguistic Diversity and Digital Humanities, University of Helsinki, Helsinki, Finland
- Learning, Digitalization, and Sustainability, Jönköping University, Jönköping, Sweden
- Digital Humanities, Linnaeus University, Växjö, Sweden
- Humanidades Digitales, Universitat Politècnica de València (UPV), Valencia, Spain
- Digital Humanities, Universitat de Barcelona, Barcelona, Spain
- Digital and Public Humanities, Ca’ Foscari University of Venice, Venice, Italy
- Digital Humanities and Digital Knowledge (DHDK), University of Bologna, Bologna, Italy
- Human-centered Artificial Intelligence, University of Pavia, Pavia, Italy
- Communication & Information Studies: Digital Humanities, University of Groningen, Groningen, Netherlands
- Digital Humanities, King’s College London — Faculty of Arts & Humanities, London, United Kingdom
- Digital Pedagogy, University of the Highlands and Islands, Daliburgh, United Kingdom
- Digital Humanities, KU Leuven, Leuven, Belgium
- Digital Humanities, University of Lausanne Faculty of Theology and Religious Studies, Lausanne, Switzerland
- Digital Humanities, Tecnológico de Monterrey — ITESM, Monterrey, Mexico
- Center for Digital Humanities, Research Institute of Korean Studies (RIKS), Seoul, South Korea
- Interdisciplinary Digital Literary Studies Program, Chungnam National University, Daejeon, South Korea
- DH-центр Уханьского университета («武汉大学数字人文研究中心»)
- DH-центр Тайваньского университета («台湾大学数位人文研究中心»)
- DH-центр Пекинского университета («北京大学数字人学实验室»)
- DH-центр Нанкинского университета («南京大学高研院数字人文创研中心»)
- DH-центр Университета Цинхуа («清华大学数字人文»)
- International Institute for Digital Humanities, Tokyo, Japan
- Digital Humanities Center for Japanese Arts and Cultures (DH-JAC), Ritsumeikan University, Kyoto, Japan
Зарубежные журналы
DH также существует в рамках академической среды, соответственно, есть огромное количество журналов, в которых публикуются исследования, эссе, обзоры, результаты экспериментов, которые так или иначе связаны с цифровыми методами в гуманитарных науках. Предлагаем вам ознакомиться с нашей подборкой журналов про DH на любой вкус:
Журнал посвящен цифровым исследованиям в области литературоведения: в нем публикуются статьи, авторы которых анализируют художественные тексты и их контексты с помощью цифровых методов.
- Digital Humanities Quarterly (DHQ)
- Digital Studies / Le champ numérique
- Journal of Cultural Analytics
- International Journal of Digital Humanities
- Digital Scholarship in the Humanities
- International Journal of Humanities and Arts Computing
- Digital Medievalist
Центральная тема журнала — цифровые методы в медиевистике, здесь можно найти оригинальные научные исследования, теоретические статьи о цифровых методах, заметки, комментарии, посвященные достижениям в области цифровой медиевистики, библиографические и обзорные статьи, учебные пособия и отчеты о проектах.
Последние статьи по теме
Мы что-то забыли? Напишите нам: [email protected]