Фото автора

Ксения Дмитриева

Редактор статей

Под капотом у языкового корпуса: как нейросети и NLP-библиотеки используются в НКРЯ

В Национальном корпусе русского языка за последние годы появилось много новых инструментов. Один из них — это «Портрет слова», который не только содержит информацию о морфологических признаках и морфемах каждого слова, но и дает представление, например, о его семантических соседях. В статье мы покажем, как пользоваться этим и другими заметными нововведениями, и расскажем, какие технологии за ними стоят.

Как скачать весь Telegram: автоматизация выгрузки каналов с помощью Python

Как получить доступ к огромным массивам текстов из Telegram, чтобы изучать язык медиа, тренды или реакцию общества на события в мире? В этом помогут Telegram Desktop, Python и библиотека pyrogram. В гайде с кодом рассказываем о методе «цепной реакции» для поиска и скачивания целых групп связанных каналов. Превратите Telegram в ваш исследовательский полигон!

Автор статей

Когда Платон встречает Python: семь статей о цифровом антиковедении

Исследователи античности очень гордятся тем, что использование цифровых методов в гуманитарных науках началось именно с классической филологии. Это произошло еще в 1960-х годах — с тех пор и возможности компьютеров шагнули далеко вперед, и количество доступных инструментов значительно возросло. Читайте в материалах нашей подборки, как классики используют 3D-модели, ГИСы, стилометрию, базы данных, сетевой анализ и многое другое, чтобы разгадывать загадки прошлого.

Маршрут перестроен: как ORBIS и сетевой анализ помогают исследовать транспортную систему Римской империи

Карфаген должен быть разрушен — но почему именно он? Возможно, дело вовсе не в злопамятности римлян, а в географии. Точнее, в транспортной сети, которую можно сегодня смоделировать с помощью ORBIS — цифрового проекта Стэнфорда. Методы сетевого анализа позволяют взглянуть на Римскую империю как на систему дорог, портов и городов, от которой в империи напрямую зависело все: торговля, власть, снабжение и, наконец, ее распад.

Только не списывай точь-в-точь: автоматический поиск аллюзий и цитат в древнеримской литературе

Аллюзиями в литературе называют отсылки на другие художественные произведения, известные высказывания и реальные исторические события, которые могут быть хорошо известны читателю. Аллюзии создают межтекстовый диалог, служат данью уважения классикам жанра и делают повествование более многоуровневым. Но как быть с текстами на латыни, где для понимания аллюзий надо понимать контекст культуры и истории Древнего Рима? Рассказываем о проекте Tesserae, который помогает находить аллюзии и цитаты в древнеримской литературе.

Жизнь и связи древних римлян: о чем могут рассказать просопографические базы данных?

Просопография занимается тем, что собирает данные о жизни и связях людей прошлого. Оцифрованные просопографические базы могут много рассказать о круге общения или перемещениях целых социальных групп или классов. На примере проекта Romans One by One рассказываем, как историки собирают такие базы, анализируют их и какие драматические сюжеты там могут скрываться.