Читать нас в Telegram

Новая GPT — большая, человечная и дорогая

Компания OpenAI представила новую версию своей языковой модели — GPT-4.5, обновление ранее выпущенной GPT-4o. В отличие от моделей линейки «o», ориентированных на решение сложных задач в области точных наук, в GPT-4.5 сделали упор на естественность ответов и на эмоциональный интеллект — это подтверждается первыми реакциями пользователей. Также модель меньше подвержена галлюцинациям.

По словам компании, версия 4.5 — их самая большая модель на данный момент. Правда, ее размер сказался на скорости генерации ответа — она существенно медленнее GPT-4o. Кроме того, использование GPT-4.5 обходится в десятки раз дороже аналогичных моделей: стоимость обработки миллиона входных токенов составляет $75, а миллиона выходных — $150, что в 30 и 15 раз превышает стоимость GPT-4o соответственно.

Обновление Claude Sonnet

Компания Anthropic, один из главных конкурентов OpenAI, выпустила обновление своей языковой модели — Claude Sonnet 3.7.

Главным нововведением стала поддержка режима рассуждений, при котором модель генерирует длинные цепочки логических выводов, существенно повышающие качество финального ответа. В отличие от конкурентов, Anthropic не стала разрабатывать две отдельные модели — одну для быстрых ответов, другую для ответов с предварительными рассуждениями, а объединила оба режима в одной модели.

В обоих режимах Claude Sonnet 3.7 либо превосходит конкурирующие модели, либо демонстрирует сопоставимые результаты. Особенно заметное преимущество наблюдается в задачах, связанных с программированием.

Цены у Sonnet 3.7 такие же, как и прошлой версии: $3 за миллион входных токенов и $15 за миллион выходных.

Anthropic была основана выходцами из OpenAI. В качестве приоритета компания считает разработку безопасного и интерпретируемого ИИ. По заявлениям гендиректора Anthropic, появление общего искусственного интеллекта можно ожидать уже к 2027 году.

Сервис для OCR от Mistral

Французская компания Mistral представила сервис для распознавания текста на фотографиях и сканах (OCR). Модель способна распознавать не только текстовую информацию, но и таблицы, изображения, графики и формулы.

По качеству распознавания сервис Mistral превосходит аналогичные решения от Google, Microsoft и OpenAI. Особое внимание разработчики уделили мультиязычности: модель нативно поддерживает письменности на основе латиницы, кириллицы и многие азиатские системы письма.

Сервис также позволяет использовать цифровой документ в качестве промта — пользователи могут задавать модели вопросы по содержанию или извлекать из документа необходимую информацию в структурированном виде (например, в формате JSON).

Доступ к сервису предоставляется через API по цене $1 за 1000 страниц. Для клиентов, которым важна конфиденциальность данных, есть возможность развернуть модель на собственных серверах.