GPT-4 снова впереди всех
Компания OpenAI выпустила обновление своей языковой модели GPT-4. Она стала лучше по ряду основных тестов, а также, по заверениям разработчика, должна отвечать более прямо и естественно.
Согласно рейтингу платформы LMSYS, где каждый может сравнить работу двух популярных моделей, обновлённая GPT опередила бывшего лидера Claude Opus, который недавно обошёл предыдущую версию GPT-4.
Анонсировано следующее поколение LLaMa
Корпорация Meta* планирует в следующем месяце выпустить новое поколение своей языковой модели LLaMa. По заявлению Meta*, планируется релиз моделей разных размеров с разным качеством, а также продуктов, основанных на них. Релиз первой версии LLaMa сыграл большую роль в развитии открытых языковых моделей и подтолкнул другие крупные компании публиковать в открытый доступ свои разработки в области LLM.
*Компания Meta признана экстремистской в России, её деятельность запрещена
Grok расшифрует мемы
xAI, лаборатория Илона Маска, выпустила обновление языковой модели Grok. По качеству Grok-1.5 сопоставим с лидерами рынка: GPT-4, Gemini, Claude, Mistral. Также xAI объявила о своей первой мультимодальной модели — Grok-1.5 Vision, которая понимает, что изображено на картинке, и способна отвечать на вопросы по ней, например, объяснять мемы и конвертировать изображение макета сайта в код. На данный момент модели не доступны для использования.
Command-R+ выложена в открытый доступ
Вышла новая языковая модель от компании Cohere. Она имеет 104 млрд параметров и доступна для всех желающих. Так же, как и Command-R, более компактная модель этой компании (35 млрд параметров), Command-R+ поддерживает работу с несколькими языками (теперь доступных языков стало больше — 13 против 10). Command-R+ была специально обучена для RAG (Retrieval Augmented Generation) — техники, при которой помимо вопроса пользователя модели дают на вход релевантную вопросу информацию, что позволяет получать более достоверные ответы. Помимо этого, модель способна эффективно использовать внешние инструменты. Например, в качестве инструмента может выступать браузер, исполнитель программного кода или API какого-то сервиса.