Модели

FastText

Модель учитывает семантику частей слов, за счёт чего лучше понимает слова с опечатками и слова не из словаря.

date_range

Год выпуска: 2016

assignment

Описание

Модель для построения векторных представлений слов, отражающих их семантику. В отличие от Word2Vec и GloVe векторное представление слова строится по векторным представлениям его n-gram: векторное представление слова равно сумме векторных представлений составляющих его n-gram. Таким образом, модель выучивает внутреннюю структуру слов, что особенно полезно в случае морфологически богатых языков.

insert_link

Статья СБь

Примеры использования:

  • поиск документов по текстовому запросу;
  • кластеризация, классификация текстов;
  • использование в качестве инициализации матрицы эмбеддингов языковых моделей

Нововведения

Учитывает морфемику, лучше справляется со словами с опечатками, позволяет получать векторные представления для слов, которые не встречались в обучающем корпусе.

Количество параметров: V * d, где V – размер словаря, d – размерность вектора

Область: NLP

Share

Recent Posts

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

25.05.2026

ИИ найдет «скрытых» детей в соцсетях по костям лица

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

19.05.2026

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…

19.05.2026