Корпус для всех: как используют НКРЯ
Зачем корпус нужен? Ответ на этот вопрос дают школьники, студенты-лингвисты и учёные. В статье рассказано о самых разных исследованиях: от сложностей перевода на другой язык культурных реалий на примере книг Набокова до возникновения фразы «ибо нефиг» и особенностей применения частного и местного падежей в современном языке.
Время чтения: 10 минут
От древнерусского до корпуса блогов: как изменился Национальный корпус русского языка после редизайна
В последние годы НКРЯ преобразился: дизайн стал удобнее и современнее, появилась мобильная версия. Изменения были не только внешними: добавились новые корпуса, например, блогов и социальных сетей (в том числе интернет-сленга), литературы для детей от 2 до 15 лет, и новые инструменты, такие как подсчёт частотности употребления, поиск похожих слов и коллокаций*, стала доступна статистика по самому корпусу.
*Коллокация — словосочетание, в котором выбор первого слова проходит по смыслу, а второго — в зависимости от первого слова, например: роль — играет, значение — имеет, но не наоборот. Отсюда поиск коллокаций — это поиск слов, с которыми искомое слово встречается чаще всего.
Время чтения: 12 минут
Я/МЫ НКРЯ: что происходит с национальным корпусом
Ещё в 2019 году будущее НКРЯ было неясным: в какой-то момент перестал работать ряд необходимых функций на сайте, и лингвисты забили тревогу. Проблемы в итоге решились, а материал «Системного Блока» про историю НКРЯ и сложности поддержки настолько масштабного проекта — остался.
Время чтения: 10 минут
Что мы узнали об ударении в русском языке и о наивной поэзии из корпуса stihi.ru
НКРЯ — это не единый массив текстов, а сложная структура, включающая в себя разные корпуса: параллельные, исторические, мультимедийный… Эта статья рассказывает об акцентологическом корпусе, полезном для изучения ударений.
Время чтения: 8 минут
Русско-китайский корпус НКРЯ, или Как превратить ботвинью в гаспачо
Первый параллельный корпус — русско-английский — появился в НКРЯ в 2005 году. Сейчас в его составе уже 28 параллельных корпусов. Русско-китайский корпус был запущен в 2016 году. Он содержит более 1000 текстов и поддерживает ввод запроса кириллицей, иероглифами и пиньинем — китайской транскрипцией.
Время чтения: 15 минут
Тест: Узнаете ли вы подкорпус НКРЯ по характерным для него словам?
Среди материалов «Системного Блока» про НКРЯ — не только просветительские, но и развлекательные. Попробуйте проверить свою интуицию, разбираясь в жанрах, тематиках и стилях текстов, а заодно познакомьтесь поближе с корпусом 🙂
Кстати, у корпуса есть официальный канал в Telegram — подписывайтесь, если вам интересны его новости.