Модели

Kandinsky 2.1

Мультиязычная модель для генерации изображений по текстовому описанию

date_range

Год выпуска: 2023

assignment

Описание

Kandinsky – модель, способная генерировать изображения по текстовым описаниям на разных языках. Архитектурно модель похожа на DALL-E 2, однако в отличие от DALL-E 2, Kandinsky генерирует сначала векторное представление изображения, подобно Stable Diffusion, а затем декодирует изображение из полученного векторного представления. Поддержка нескольких языков была достигнута использованием мультиязычной версии модели CLIP. 

Примеры использования:

  • Генерация изображений
  • Дорисовка фрагментов изображения
  • Перенос стиль с одного изображения на другое
  • Генерация изображений по референсам

Нововведения

  • Поддержка текстовых описаний на нескольких языках
  • Использование более качественного автокодировщика, чем в Stable Diffusion

Количество параметров: 3.22B

Share

Recent Posts

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

25.05.2026

ИИ найдет «скрытых» детей в соцсетях по костям лица

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

19.05.2026

Какая математика нужна джуну в NLP?

Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…

19.05.2026