Читать нас в Telegram
язык произведений русской литературы
Иллюстратор: Женя Родикова

Векторная модель word2vec умеет работать со значениями слов — находить для них ближайшие синонимы, складывать и вычитать вектора смыслов (бык — самец + самка = … корова). Технология распознает смысл слова исходя из контекста. На основе анализа больших массивов текстов модель учится понимать, например, что слова «лампа» и «светильник» похожи (так как часто употребляются в схожих контекстах), а «лампа» и «лама» — нет. С помощью таких векторных моделей можно сравнить два одинаковых текста на разных языках, проанализировать смысловую связь значений слов или даже создать «альтернативные» версии великих произведений русской литературы.

Распознать тексты русских классиков можно по определенному стилю их авторов. А вот если заменить слова из оригинальных произведений на их векторные альтер-эго, опознать всем известные тексты будет гораздо сложнее. Давайте проверим, сможем ли мы узнать произведения русской классики, если некоторые слова в них будут заменены на близкие по смыслу.