Год выпуска: 2016
Описание
Модель для построения векторных представлений слов, которые отражают их семантику. В отличие от Word2Vec и GloVe векторное представление слова строится по векторным представлениям его n-gram: векторное представление слова равно сумме векторных представлений состовляющих его n-gram. Таким образом, модель выучивает внутреннюю структуру слов, что особенно полезно в случае морфологически богатых языков
Примеры использования:
1) Поиск документов по текстовому запросу;
2) Кластеризация, классификация текстов;
3) Использование в качестве инициализации матрицы эмбеддингов языковых моделей
Нововведения
Учитывает морфемику, лучше справляется со словами с опечатками, позволяет получать векторные представления для слов, которые не встречались в обучающем корпусе.
Количество параметров: V * d, где V – размер словаря, d – размерность вектора
Область: NLP