Читать нас в Telegram

Google сделала общедоступной модель для генерации и редактирования изображений Gemini 2.5 Flash Image. По оценкам пользователей платформы LMArena, она признана лучшей среди аналогов.

Как и предыдущая версия, модель умеет создавать стилизованные изображения, генерировать изображения по эскизам, строить изометрические проекции объектов с фотографий и выполнять множество других задач.

Главное улучшение — точность редактирования: теперь модель гораздо лучше сохраняет неизменными те части изображения, которых запрос не касается. Например, при смене прически на фото черты лица остаются прежними, чего раньше достичь было сложно. Еще одна новая возможность — работа с несколькими входными изображениями. Пользователь, например, может загрузить фото пустого интерьера и снимки мебели, а затем попросить модель «обставить» комнату выбранными предметами.

Gemini 2.5 Flash Image доступна для всех через Google AI Studio.

Почему это важно?

Технологии генерации и редактирования изображений с помощью ИИ стремительно развиваются и становятся более распространенными. Это меняет то, как мы воспринимаем визуальный контент и взаимодействуем с ним.

Крупные игроки рынка уже интегрируют такие инструменты в свои продукты: Adobe внедрила ИИ-редактирование в Photoshop и видеоредакторы, многие производители смартфонов используют нейросети для улучшения качества снимков. Так, Google применяет нейросети для реализации 100-кратного зума в смартфонах Pixel — функция, невозможная только за счет мобильного сенсора — фактически это уже не фотография, а сгенерированное изображение.