Мария Подрядчикова, автор проекта Системный Блокъ

Мария Подрядчикова

Автор

Использую digital humanities, чтобы сделать жизнь немного веселее. Ищу вещи в НКРЯ: https://t.me/ruscorpora_is_fun

Автор статей

Лингвистика 06.08.2025

Под капотом у языкового корпуса: как нейросети и NLP-библиотеки используются в НКРЯ

В Национальном корпусе русского языка за последние годы появилось много новых инструментов. Один из них — это «Портрет слова», который не только содержит информацию о морфологических признаках и морфемах каждого слова, но и дает представление, например, о его семантических соседях. В статье мы покажем, как пользоваться этим и другими заметными нововведениями, и расскажем, какие технологии за ними стоят.

Мария Подрядчикова

Тесты, Филология 11.07.2025

Тест: как менялось значение слов в Национальном корпусе русского языка

Слова, как и люди, любят компанию. У каждого есть свой круг «общения» — другие слова, которые часто встречаются рядом с ним в схожих контекстах. Однако этот круг меняется со временем. В XIX веке у слова могли быть одни «приятели», а в XXI — совершенно другие. С помощью Национального корпуса русского языка мы можем заглянуть в прошлое и увидеть, как трансформировались эти семантические окрестности. Сможете ли вы опознать слово, зная лишь его «компанию» из разных эпох? Пройдите наш тест и проверьте свою лингвистическую интуицию!

Мария Подрядчикова

Глоссарий, Лингвистика 07.03.2025

Что такое список Сводеша?

Для того, чтобы определить степень родства двух языков, часто сравнивают их лексический состав. Рассказываем о списке Сводеша — инструменте, созданном американским лингвистом Моррисом Сводешем для сравнения языков.

Мария Подрядчикова, Филипп Тучак

Тесты 16.10.2024

Тест: угадайте произведение по частотным словам из Национального корпуса русского языка

В каком произведении школьной программы умирают лягушки, а в каком — скачут блохи? Пройдите наш тест на основе Национального корпуса русского языка и попробуйте отличить Гоголя от Салтыкова-Щедрина, а Лермонтова от Блока.

Мария Подрядчикова

Глоссарий, Филология 10.05.2024

Дневники, письма, конспекты: что такое эго-документ?

Историю можно изучать не только по летописям или книгам, но и по частным источникам, или эго-документам: письмам, дневникам, записным книжкам. Рассказываем об эго-документах и связанных с ними цифровых исследованиях.

Мария Подрядчикова

Лингвистика, Обзоры, Филология 29.04.2024

Национальному корпусу русского языка — 20 лет: подборка

Мы собрали лучшие материалы «‎Системного Блока»‎, посвящённые главной цифровой коллекции текстов на русском языке: художественных, научных, церковнославянских, диалектных, списанных с бересты, поэтических, памятников литературы с XI века и многих других.

Мария Подрядчикова

Глоссарий 26.02.2024

Что такое capta и чем отличается от больших данных?

Рассказываем про вид данных, отличающийся от привычных big data, и чем малые данные похожи на археологический раскоп.

Мария Подрядчикова

Лингвистика, Тесты 09.02.2024

👋 Тест: какой вы жест из мультимедийного корпуса русского языка?✍️

«Закатить глаза» или «троекратный поцелуй»? Узнайте, каким жестом вы были бы во вселенной мультимедийного корпуса русского языка.

Мария Подрядчикова

Филология 07.02.2024

Понять Льва Толстого: как векторно-семантические модели помогают литературоведам

Идиостиль — это авторский стиль писателя. И если на небольших стихах его изучать удобно, то вот на текстах Льва Толстого — очень непросто. Рассказываем, как филолог Борис Орехов использует векторно-семантические модели для анализа идиостиля Толстого.

Мария Подрядчикова

Лингвистика, Тесты 28.08.2023

Бабка, гаишник и Чапаев входят в бар, а он им как раз. Тест: Узнаете ли вы подкорпус НКРЯ по характерным для него словам?

Какие слова чаще встречаются в анекдотах, а какие — в деловых документах? Узнать это можно на сайте Национального корпуса русского языка, на основе которого мы придумали тест. Проверьте, насколько хорошо вы разбираетесь во всем разнообразии текстов на русском языке — от смс-сообщений до классической литературы.

Мария Подрядчикова

История, Филология 19.06.2023

От кыргызского эпоса до ChatGPT: что обсуждали на круглом столе «Digital Humanities в Центральной Азии»

15 марта 2023 года прошёл круглый стол «Digital Humanities в Центральной Азии» — серия панельных дискуссий, на которых учёные из стран Центральной Азии обсудили цифровые гуманитарные исследования и проекты в регионе. Участница Системного Блока сходила на мероприятие и рассказывает, о чем там говорилось.

Мария Подрядчикова

NLP, Лингвистика 06.05.2023

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

Национальный корпус русского языка (НКРЯ) — важнейший инструмент любого исследователя, который занимается русским языком, русской литературой и вообще русской словесной культурой. Изменения в работе НКРЯ были заметны ещё в 2019 году: тогда лингвисты высказали опасения о возможном закрытии сервиса. К счастью, проблемы оказались временными, и НКРЯ не только не прекратил свою работу, но и заметно изменился и расширился. Самым заметным обновлением стал новый дизайн сайта, но есть и много глубоких содержательных перемен. Об основных обновлениях в корпусе, очевидных и не очень — в нашем сегодняшнем материале.

Мария Подрядчикова

Филология 21.01.2022

Как Джордж Вашингтон стал эмо: Google N-grams в ТикТок трендах

Если вы были в ТикТок, то знаете, что тренд там можно сделать из чего угодно. Пару месяцев назад сотни тысяч просмотров начали набирать записи экрана с сайта Google Books Ngram Viewer, показывающем популярность слова в определенный период времени. Пользователи находят слово «эмо» в 1803 году или упоминание «Звёздных войн» — в 1696

Мария Подрядчикова

Филология 27.02.2020

ОТСТАВНОЙ КОЗЫ ПРОДЮСЕР: генерируем названия книг Дарьи Донцовой

Как генерировать названия детективов в стиле Донцовой с помощью списка фразеологизмов, семантических векторов и морфологического анализатора

Мария Подрядчикова

Под капотом у языкового корпуса: как нейросети и NLP-библиотеки используются в НКРЯ

Тест: как менялось значение слов в Национальном корпусе русского языка

Что такое список Сводеша?

Тест: угадайте произведение по частотным словам из Национального корпуса русского языка

Дневники, письма, конспекты: что такое эго-документ?

Национальному корпусу русского языка — 20 лет: подборка

Что такое capta и чем отличается от больших данных?

👋 Тест: какой вы жест из мультимедийного корпуса русского языка?✍️

Понять Льва Толстого: как векторно-семантические модели помогают литературоведам

Бабка, гаишник и Чапаев входят в бар, а он им как раз. Тест: Узнаете ли вы подкорпус НКРЯ по характерным для него словам?

От кыргызского эпоса до ChatGPT: что обсуждали на круглом столе «Digital Humanities в Центральной Азии»

От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна

Как Джордж Вашингтон стал эмо: Google N-grams в ТикТок трендах

ОТСТАВНОЙ КОЗЫ ПРОДЮСЕР: генерируем названия книг Дарьи Донцовой

О проекте

Контакты

СОЦСЕТИ

Теги

Темы