NLP

Во что превращается жизнь без любви

Как компьютеры сравнивают значения слов, и почему это бывает смешно

Недавно мы писали о том, как компьютеры «понимают» значения слов благодаря дистрибутивным моделям (их еще называют векторными). Таким моделям не нужно толковых словарей, энциклопедий и справочников. Просто дайте им Очень. Много. Текстов — и вуаля, они могут сказать, что помидор и томат очень похожи по смыслу, а помидор и лингвистика — совсем нет.

Но дистрибутивные модели умеют не только сравнивать слова по смысловой близости. Еще они могут складывать и вычитать значения — в самом прямом арифметическом смысле. Например, такая модель (и без всякого искусственного интеллекта!) выдаст вам слово «королева», если вы скомандуете взять «короля», вычесть из него «мужчину» и прибавить «женщину». Кстати, вы можете воспроизвести это сами на rusvectores.org (который мы тоже уже показывали) в разделе семантический калькулятор. Советуем использовать модель, обученную сразу на Национальном корпусе русского языка и русской Wikipedia.

Еще пара примеров. Вычтем из птицы крыло и прибавим плавник:

А теперь немного похулиганим — вычтем из Гитлера Германию и прибавим СССР. Конец немного предсказуем:

Напоследок — философский вопрос. А что будет, если из слова жизнь вычесть слово любовь?

Как видите, дистрибутивные модели — те еще философы. Напоминаем, ни в одном случае модель на самом деле не обладает никаким настоящим знанием о значениях слов. Такой результат получается благодаря тому, что модель запоминает контексты употребления каждого слова в виде вектора (т.е. попросту набора чисел — с какой частотой встречались рядом с этим словом другие слова). А про вектора мы помним со школы, что их можно складывать и вычитать. Так и работает семантический калькулятор.

Share

Recent Posts

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

25.05.2026

ИИ найдет «скрытых» детей в соцсетях по костям лица

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

19.05.2026

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…

19.05.2026