DeepSeek-V3.1: одна модель вместо двух

Обновленная LLM быстрее, компактнее и по-прежнему самая дешевая в своем классе.

11.09.2025

Компания DeepSeek представила обновление своей большой языковой модели DeepSeek-V3.

Разработчики фокусировались на развитии агентных возможностей: способности модели автономно выполнять задачи на компьютере. О важности агентов в развитии ИИ мы писали в дайджесте.

Архитектура модели осталась прежней, но теперь нет разделения на «рассуждающую» и «быструю» версии — DeepSeek-V3.1 объединяет оба режима. В режиме рассуждений она показывает те же результаты в тестах по математике и программированию, что и предыдущая версия, но генерирует более лаконичные промежуточные размышления. Другими словами, разработчики ускорили модель без потери качества.

Стоимость доступа к API незначительно выросла, однако DeepSeek-V3.1 по-прежнему остается самой дешевой из сопоставимых моделей. Веса модели опубликованы в открытом доступе под лицензией, разрешающей коммерческое использование. Попробовать модель можно через официальный сайт и мобильное приложение. Подробнее о DeepSeek и работе с ним мы рассказывали ранее.

Почему это важно?

LLM от DeepSeek популярна как среди энтузиастов, так и среди широкой аудитории. Подробная техническая статья о DeepSeek-R1 открыла open-source сообществу простой и надежный метод обучения рассуждающих моделей, аналогичных закрытой o1 от OpenAI, что значительно сократило разрыв между проприетарными и открытыми LLM.

Данные, генерируемые моделями DeepSeek, активно используются для обучения других моделей. По слухам, ими пользуются не только независимые разработчики и небольшие компании, но и крупная французская ИИ-компания Mistral.

Автор: Михаил Ким

Теги:ИИ, нейронные сети, нейросети, новости

Next Grok-2.5 выложена в открытый доступ »

Previous « Новый DeepSeek, интерактивная симуляция миров от Google и Grok-2 в открытом доступе

Tags: ИИнейронные сетинейросетиновости

11.09.2025

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

США усилили контроль над лидирующими ИИ моделями, ученые смогли полностью прочитать античный свиток, не разворачивая его — что произошло в…

06.07.2026

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Агенты, которые самостоятельно планируют свои действия и пользуются внешними инструментами. Модели, способные работать с миллионами токенов. Системы, которые помогают сохранять…

02.07.2026

Новости

Национальный корпус русского языка вырос в шесть раз

Теперь в него входят тексты ВКонтакте — почти 11,3 млрд слов из соцсетей

30.06.2026

DeepSeek-V3.1: одна модель вместо двух

Related Post

Recent Posts

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Национальный корпус русского языка вырос в шесть раз