Генерация видео в Midjourney
Midjourney, один из первых успешных сервисов по генерации изображений, объявил о запуске функции создания видео.
В отличие от моделей OpenAI Sora и Google Veo 3, которые фокусируются на создании видео по текстовым описаниям, решение от Midjourney специализируется на анимации уже существующих изображений.
Пользователь может сгенерировать изображение на сайте компании, а затем анимировать его одним из двух способов: воспользоваться функцией автоматического анимирования или текстом описать желаемое движение объектов и камеры. Те же действия можно выполнить и с загруженными пользователем изображениями.
Для анимации доступны два режима: high motion и low motion. Первый режим подходит для сцен, где камера практически неподвижна, а объекты малоподвижны. Второй режим оптимален для создания динамичных видео. После генерации пользователь может продлить видео на четыре секунды, причем эту операцию можно применить к одному ролику максимум четыре раза.
Стоимость генерации 5-секундного видео на данный момент в восемь раз превышает цену за создание одного изображения. Впрочем, компания планирует корректировать расценки в будущем в зависимости от спроса.
По заявлению Midjourney, новая модель является важным шагом к реализации глобальной цели — разработке искусственного интеллекта, способного в реальном времени формировать интерактивный 3D-мир, где пользователи смогут свободно перемещаться и взаимодействовать с объектами и персонажами.
Meta инвестирует в Scale AI
Корпорация Meta проинвестировала 14 млрд долларов в Scale AI — стартап, специализирующийся на разметке данных для обучения моделей искусственного интеллекта.
В результате этой сделки Meta приобрела 49% акций Scale AI, тем самым оценив стартап в 29 млрд долларов. Кроме того, основатель Scale AI, 28-летний Александр Ван, присоединится к команде Meta по разработке ИИ.
Услугами Scale AI пользуется множество крупных компаний, включая основных конкурентов Meta в ИИ-гонке — OpenAI и Google. По сообщениям СМИ, после объявления об инвестициях конкуренты Meta начали постепенно сворачивать сотрудничество со Scale AI.
Mistral выпустила первую рассуждающую модель
Французская компания Mistral представила Magistral — свою первую рассуждающую (reasoning) языковую модель (LLM). Рассуждающие модели генерируют развернутую цепочку логических рассуждений перед формированием финального ответа, что значительно повышает его качество и обоснованность. Примеры таких моделей — GPT o1 и o3 от OpenAI, Claude Sonnet в режиме extended thinking, Gemini 2.0 Flash Thinking и Gemini 2.5 от Google и R1 от DeepSeek.
По сравнению с предыдущим флагманом французской компании, Mistral Medium, новая модель сильно улучшила результаты в основных тестах. Однако в сравнении с конкурирующей DeepSeek-R1 она показывает сопоставимые или несколько более низкие результаты.
Magistral выпущена в двух версиях — Medium и Small. Более мощная версия Medium доступна только через API, тогда как Small, уступающая по качеству, распространяется в открытом доступе.
Mistral долгое время оставалась одной из немногих крупных ИИ-компаний, не выпускавших рассуждающие модели. После выхода Magistral среди лидеров отрасли только Meta не предлагает подобного функционала — ее модель Llama 4 по-прежнему не поддерживает режим рассуждений.
* Российские власти считают Meta террористической организацией