В рубрике «Лингвистика» собраны материалы о том, как цифровые методы помогают изучать язык. Здесь мы рассказываем о том, как технологии используются в корпусах, семантике, типологии, машинном переводе, для изучения языкового разнообразия и других направлениях на стыке лингвистики и гуманитарных наук.
Вот уже больше 150 лет люди шлют друг другу открытки — поздравляют, сообщают о своих делах, передают просьбы. В открытках…
В России существуют десятки малых, или миноритарных, языков, которые находятся под угрозой исчезновения. Однако благодаря цифровым технологиям у них появляется…
Чтобы грамотно составить корпус текстов, который помогал бы отвечать на вопросы о выбранном языке, недостаточно просто взять все книги, которые…
Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать…
Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты…
В Национальном корпусе русского языка за последние годы появилось много новых инструментов. Один из них — это «Портрет слова», который…
Как получить доступ к огромным массивам текстов из Telegram, чтобы изучать язык медиа, тренды или реакцию общества на события в…
Кто-то, где-то, что-то, как-то, почему-то. Все мы часто используем неопределенные местоимения. Они спасают нас в минуту неуверенности и незнания. В…
Коллокации — это словосочетания, в которых слова часто встречаются рядом. Рассказываем, как устроены коллокации и какие есть способы их выявлять.…
Для того, чтобы определить степень родства двух языков, часто сравнивают их лексический состав. Рассказываем о списке Сводеша — инструменте, созданном…