Модели

Word2Vec

Модель, которая преобразовывает слова в числовые векторы, отражающие семантические значения и взаимосвязи слов

date_range

Год выпуска: 2013

assignment

Описание

Модель, которая семантически пребразует слова в векторы. В основе работы модели лежит дистрибутивная гипотеза: если два слова часто встречаются в похожих контекстах, то эти два слова семантически похожи. Если два слова похожи, то расстояние между их векторами также будет невелико.

Помимо этого в пространстве векторов, образуемых моделями, можно производить различные семантические манипуляции: если вычесть из вектора слова «король» вектор слова «мужчина» и прибавить вектор слова «женщина», то получится вектор, близкий к вектору слова «королева».

insert_link

Статья СБь

Примеры использования:

  • Поиск документов по текстовому запросу
  • Кластеризация, классификация текстов
  • Использование в качестве инициализации матрицы эмбеддингов языковых моделей

Нововведения:

Векторные представления отображают семантику слов

Количество параметров: V * d, где V – размер словаря, d – размерность вектора

Область: NLP

Share

Recent Posts

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

25.05.2026

ИИ найдет «скрытых» детей в соцсетях по костям лица

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

19.05.2026

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…

19.05.2026