NLP

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно,…

19.05.2026

ИИ-компании взялись за медицину, Anthropic выложила конституцию Claude, OpenAI запускает рекламу в ChatGPT

OpenAI и Anthropic выпустили ИИ-продукты для сферы здравоохранения, Anthropic опубликовала документ, определяющий идентичность и поведение её LLM, а в ChatGPT…

26.01.2026

ИИ-итоги 2025: рассуждающие модели, агенты, партнеры по разуму

Подводим итоги и рассказываем о самых важных событиях в мире ИИ за прошедший год

01.01.2026

Gemini 3, новый DeepSeek, SAM 3

Новое поколение LLM от Google, свежий DeepSeek и модель для сегментации изображений и видео от Meta* — что произошло в мире ИИ за последнее время Google Gemini 3

04.12.2025

Когда Платон встречает Python: семь статей о цифровом антиковедении

Исследователи античности очень гордятся тем, что использование цифровых методов в гуманитарных науках началось именно с классической филологии. Это произошло еще…

13.08.2025

Может ли GPT найти связь Хармса с Брюсовым?

Можно ли с помощью нейросетей находить скрытые цитаты, аллюзии и сближения в художественных текстах? Конечно! Что будет, если объединить силу…

11.06.2025

Такая разная лингвистика: подборка интервью «Системного Блока»

Политизированные споры вокруг разграничения русского, украинского и белорусского языков, междисциплинарные исследования нейролингвистов, аудиозаписи Александра Блока. В фокусе новой подборки интервью…

16.04.2025

DeepSeek-V3

Третья версия языковой модели от DeepSeek

31.12.2024

DeepSeek-R1

Одна из первых open-source рассуждающих языковых моделей, сравнимых с OpenAI o1

31.12.2024

A real area: что такое ареальная типология и как её изучают цифровыми методами

В мире почти 7000 языков, и они очень разные. Лингвистическая типология — раздел науки о языке, описывающий эти различия. Часто,…

14.12.2024

Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP

Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем…

22.10.2024

Как поймать бактерию на плагиате: чем поиск переноса генов похож на NLP

Не только филологов и юристов волнует проблема авторства. Живые организмы тоже могут списывать друг у друга — прямо из генетического…

03.10.2024

Языковые модели — это адронный коллайдер для языка: интервью с Татьяной Шавриной

Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? Что делать с тем, что коммерческие продукты…

19.08.2024

Как автоматически расшифровать аудио: пошаговая инструкция для Whisper

Расшифровка аудиозаписи — дело утомительное и времязатратное. К счастью, появляется всё больше сервисов, которые умеют это делать автоматически. Рассказываем, как…

06.02.2024

Kandinsky 2.1

Мультиязычная модель для генерации изображений по текстовому описанию

22.03.2023

GPT-4

Четвёртое поколение генеративных языковых моделей GPТ. Модель решает задачи качественнее GPT-3, а также умеет работать с изображениями.

15.03.2023

LLaMa

Семейство эффективных языковых моделей от Meta, доступное для некоммерческого использования всем желающим

27.02.2023

С приветом из Англии: у мультиязычных языковых моделей обнаружился «английский акцент»

Если вы выучили иностранный язык во взрослом возрасте, вполне вероятно, вы говорите на нем не так же бегло, как носитель…

01.02.2023

«Размечено»: как распознавать именованные сущности в исторических дневниках

Дневники людей, живших в различных исторических эпохах, могут многое сказать исследователю, но анализировать их вручную — тяжело и долго. Разбираемся,…

12.07.2022

Midjourney

Самая известная модель для генерации изображений по текстовому описанию

22.06.2022

DALL-E 2

Улучшение модели DALL-E, генерирующей изображения по текстовому описанию

22.06.2022

Русская классика глазами нейросети ruDALLE

Как видит русскую классику нейросеть ruDALLE? Пройдите тест и попробуйте угадать, что скрывается под изображениями

08.01.2022

ChatGPT

GPT-3, обученная понимать и исполнять текстовые запросы и доступная всем желающим через веб сайт

02.01.2022

InstructGPT

GPT-3, которая обучена понимать и исполнять текстовые запросы

01.01.2022

Stable Diffusion

Одна из самых популярных открытых моделей для генерации изображений по текстовому описанию

22.06.2021

DALL-E

Одна из первых моделей, генерирующих качественные изображения по текстовому описанию

22.06.2021

CLIP

Мультимодальная модель, способная строить векторные представления текстов и изображений

22.06.2021

Виден ли конец «нейронного блицкрига»: компьютерные лингвисты между вычислениями и теорией. Расшифровка подкаста с Денисом Кирьяновым

Публикуем материалы к восьмому выпуску подкаста «Неопознанный Искусственный Интеллект»: текст расшифровки выпуска, оглавление, полезные ссылки и термины.

28.04.2021

GPT-3

Третье поколение генеративных языковых моделей GPТ. Значительно больше GPT-2, умеет решать новые задачи без обучения

01.01.2021

Бэггинсы, Кольца и Сауроны: как научить компьютер понимать кто есть кто?

Как помочь компьютеру понять, что Гарри — волшебник, Гендальф — майар, а Джон Сноу — (СПОЙЛЕР!) одновременно Старк и Таргариен?…

04.09.2020

Как управлять мамонтом: генерируем нужные тексты с помощью моделей Plug and Play

Нейросети хорошо порождают правдоподобный текст. Но как заставить их писать на нужную тему, да еще и с нужным отношением к…

13.03.2020

Журналисты VS роботы: неравный бой

Искусственный интеллект — друг или враг журналисту? Чтобы ответить на этот вопрос, изучаем 10 свежих AI-проектов со всего мира мира

09.03.2020

Как начать свой путь в NLP (не путать с НЛП)

Хотите разобраться в автоматической обработке языка и стать NLP-инженером? Вам сюда

02.12.2019

Translate-баттл: могут ли онлайн-переводчики передавать стиль текста?

«Мой мозг застрял в черепе», «He was introduced to the wells», «филиал исследований» и другие приключения онлайн-перевода

01.08.2019

8 главных прорывов в нейросетевом NLP

Как компьютерная лингвистика подсела на нейронные сети и диплернинг, какие подходы сегодня в тренде и почему они так хороши

26.07.2019

Что такое кросс-языковая морфология и зачем она нужна

Машинный перевод и другая компьютерно-лингвистическая магия работают тогда, когда есть много данных для обучения нейросетей. Но что делать, если язык…

19.07.2019

Розовые слоны и красные деревья: цвета в языке и в реальной жизни

Компьютерная лингвистика утверждает, что слоны розового цвета. Разбираемся, как так вышло

17.06.2019

У вас вся спина белая: как искусственный интеллект учится шутить

Шутки — дело серьезное. Исследовательница из Стенфорда Хё Хё точно это знает, потому что она разрабатывает генератор каламбуров для искусственного…

06.06.2019

Фасолина или яйцо? С чем сравнивают размеры вещей

Какие метафоры популярны при описании габаритов предмета, как они изменялись со временем и почему из сравнений исчезли голубиные яйца

30.05.2019

Что не так с машинным переводом?

Так ли хороши нейросети под капотом Google.Translate? Разбор с пристрастием

03.05.2019

Как машинный перевод оценивает… машина?

Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?

30.04.2019

Что в смайлике тебе моем?

🆕 семантический анализ эмодзи или как мы выучили новый язык сами того не подозревая

18.03.2019

Машинный перевод: как это работает

Нейросети отбирают хлеб у переводчиков!

15.03.2019

Мне только спросить: лингвистика и большие данные объединяются для помощи врачам

Не можете разобрать врачебный почерк? NLP спешит на помощь!

06.03.2019

GPT-2

Второе поколение генеративных языковых моделей GPТ. Cпособна обучаться решать новые задачи на основе всего нескольких примеров

01.01.2019

Рождение говорящих машин

Сейчас каждый может закадрить яндексовскую Алису — и отхватить виртуальную пощечину. Но так было не всегда

15.11.2018

Многабукаф, ниасилил: как алгоритмы оценивают сложность текста

Понятен ли текст? Тяжело ли его читать? Как измерить его сложность? Эти вопросы волнуют многих. Методистов, которым необходимо понимать, подходит…

19.08.2018

«Жить и умереть в Париже»: 300 лет русской поэзии на карте

Исследование проводилось на поэтическом подкорпусе Национального корпуса русского языка. Он содержит тексты русских поэтов, написанные в XVIII — XXI веках. Авторы…

13.08.2018

BERT

Одна из первых больших языковых моделей, использующих архитектуру Transformer

14.05.2018

ELMo

Языковая модель, позволяющая получать векторные представления слова, учитывающие его контекст

14.05.2018

GPT

Одна из первых больших генеративных языковых моделей с архитектурой Transformer

02.05.2018

FastText

Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.

14.05.2016

GloVe

Улучшение Word2Vec, которое учитывает не только локальные взаимосвязи слов, но и связи слов в рамках всего корпуса

14.05.2014

Word2Vec

Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов

14.05.2013