Модель теперь воспринимает текст и визуальные данные как единое пространство
В последнем обновлении GPT-4o значительно улучшилось качество генерации изображений. Теперь модель рисует более фотореалистичные сцены, точнее передает текст на изображениях и уверенно редактирует их: добавляет или удаляет объекты, применяет стилизации, такие как перерисовка в стиле студии Ghibli.
Ключевое отличие: GPT-4o теперь нативно обрабатывает текст и изображения вместе, без необходимости задействовать отдельную нейросеть вроде DALL·E. Такой подход, впервые анонсированный при запуске GPT-4o («o» — от слова Omni), позволил интегрировать работу с визуальными и аудиоданными в единую систему.
Полноценный доступ к этим возможностям стал доступен только сейчас.
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
Можно ли заниматься NLP, если при словах «производная» и «матрица» хочется закрыть ноутбук? Да — если изучать математику не абстрактно, а через реальные задачи. Объясняем, какие разделы действительно нужны джуну,…