NLP

В рубрике «NLP» собраны материалы об обработке естественного языка и технологиях, которые работают с текстом и речью. Здесь мы объясняем, как устроены большие языковые модели, чат-боты, машинный перевод, поиск и другие инструменты на стыке лингвистики и компьютерных наук.

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно,…

19.05.2026

Списывание XXI века: как определить, что эссе написал ИИ

Трансформеры с помощью fine-tuning узнают, написал ли эссе искусственный интеллект или человек. Рассказываем о различных методах идентификации ИИ-текста и актуальных…

06.05.2026

Пьющих просьба не беспокоить: анализируем язык объявлений о сдаче квартир с помощью LLM

Что нужно человеку, чтобы снять квартиру в России? Каждый, кто читал объявления на популярных сайтах, знает, что нужно не только…

12.03.2026

Нейросеть-алкотестер: как ваша речь может выдать вас с головой

Алкотестер в каждой машине — звучит слишком хорошо, чтобы быть правдой? А если алкотестер — это ваш собственный голос? Достаточно…

11.03.2026

Ничего, кроме правды: как заставить LLM сомневаться в своих ответах

Почему большие языковые модели врут с абсолютной уверенностью? Можно ли заставить их быть интеллектуально честными? Ответ кроется не в этике,…

04.02.2026

Что такое фреймбанки и зачем экономистам лингвистика

Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать…

08.12.2025

Нейротикток от OpenAI, новая модель Anthropic, новый тест для LLM

OpenAI выпустила Sora 2, приложение с ИИ-тиктоками и новый тест, проверяющий производительность LLM в реальных рабочих задачах, Anthropic обновила свою…

08.10.2025

Нейросети помогают ученым исследовать уравнения, LLM побеждают в олимпиаде по программированию

Ученые придумали автоматический способ исследования математических задач с помощью нейросетей, LLM от Google и OpenAI заняли призовые места в международной…

27.09.2025

Как узнать тематический состав корпуса для обучения LLM

Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты…

17.09.2025

Anthropic согласилась заплатить правообладателям книг, новый лучший генератор изображений от Google и полностью открытая LLM из Швейцарии

Anthropic готова заплатить 1,5 млрд долларов за использование пиратских книг, новая модель для генерации изображений от Google и открытая мультиязычная…

11.09.2025