Лингвистика

В рубрике «Лингвистика» собраны материалы о том, как цифровые методы помогают изучать язык. Здесь мы рассказываем о том, как технологии используются в корпусах, семантике, типологии, машинном переводе, для изучения языкового разнообразия и других направлениях на стыке лингвистики и гуманитарных наук.

«Игуменья» или «пионер»: чем отличаются слова в дореволюционных и советских открытках

Вот уже больше 150 лет люди шлют друг другу открытки — поздравляют, сообщают о своих делах, передают просьбы. В открытках…

14.05.2026

Corpus и Status: как технологии помогают сохранять миноритарные языки России

В России существуют десятки малых, или миноритарных, языков, которые находятся под угрозой исчезновения. Однако благодаря цифровым технологиям у них появляется…

13.03.2026

Брюхоногие моллюски, гастрит и редкие фамилии: как сделать языковой корпус репрезентативным

Чтобы грамотно составить корпус текстов, который помогал бы отвечать на вопросы о выбранном языке, недостаточно просто взять все книги, которые…

21.01.2026

Что такое фреймбанки и зачем экономистам лингвистика

Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать…

08.12.2025

Как узнать тематический состав корпуса для обучения LLM

Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты…

17.09.2025

Под капотом у языкового корпуса: как нейросети и NLP-библиотеки используются в НКРЯ

В Национальном корпусе русского языка за последние годы появилось много новых инструментов. Один из них — это «Портрет слова», который…

06.08.2025

Как скачать весь Telegram: автоматизация выгрузки каналов с помощью Python

Как получить доступ к огромным массивам текстов из Telegram, чтобы изучать язык медиа, тренды или реакцию общества на события в…

05.08.2025

Что неопределенность рассказывает нам о языке — и как это посчитать

Кто-то, где-то, что-то, как-то, почему-то. Все мы часто используем неопределенные местоимения. Они спасают нас в минуту неуверенности и незнания. В…

12.07.2025

Что такое коллокации и как они помогают гуманитариям

Коллокации — это словосочетания, в которых слова часто встречаются рядом. Рассказываем, как устроены коллокации и какие есть способы их выявлять.…

18.04.2025

Что такое список Сводеша?

Для того, чтобы определить степень родства двух языков, часто сравнивают их лексический состав. Рассказываем о списке Сводеша — инструменте, созданном…

07.03.2025