В рубрике «NLP» собраны материалы об обработке естественного языка и технологиях, которые работают с текстом и речью. Здесь мы объясняем, как устроены большие языковые модели, чат-боты, машинный перевод, поиск и другие инструменты на стыке лингвистики и компьютерных наук.
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно,…
Трансформеры с помощью fine-tuning узнают, написал ли эссе искусственный интеллект или человек. Рассказываем о различных методах идентификации ИИ-текста и актуальных…
Что нужно человеку, чтобы снять квартиру в России? Каждый, кто читал объявления на популярных сайтах, знает, что нужно не только…
Алкотестер в каждой машине — звучит слишком хорошо, чтобы быть правдой? А если алкотестер — это ваш собственный голос? Достаточно…
Почему большие языковые модели врут с абсолютной уверенностью? Можно ли заставить их быть интеллектуально честными? Ответ кроется не в этике,…
Остаётся ли завтрак завтраком, если в течение дня нет ни обеда, ни ужина? С точки зрения лингвистики, это непростой вопрос. В лингвистике существует множество теорий, чтобы описать…
OpenAI выпустила Sora 2, приложение с ИИ-тиктоками и новый тест, проверяющий производительность LLM в реальных рабочих задачах, Anthropic обновила свою…
Ученые придумали автоматический способ исследования математических задач с помощью нейросетей, LLM от Google и OpenAI заняли призовые места в международной…
Датасет в машинном обучении — структурированный набор данных, который используется для тренировки моделей. Чтобы обучить большую языковую модель (LLM), датасеты…
Anthropic готова заплатить 1,5 млрд долларов за использование пиратских книг, новая модель для генерации изображений от Google и открытая мультиязычная…