DeepSeek-R1

Одна из первых open-source рассуждающих языковых моделей, сравнимых с OpenAI o1

31.12.2024

Год выпуска: 2024

Описание

Open-source рассуждающая языковая модель на основе DeepSeek-V3.

Где можно попробовать: 1, 2

DeepSeek-R1 представляет собой рассуждающую модель, способную выстраивать развернутые логические цепочки для формирования более качественных итоговых ответов.

В основе DeepSeek-R1 лежит модель DeepSeek-V3 с 671 млрд параметров. Благодаря архитектуре Mixture of Experts, при генерации ответа используется только 5,5% от общего числа параметров, причем их набор динамически подбирается в зависимости от конкретного пользовательского запроса.

Обучение модели процессу рассуждений проводилось методом обучения с подкреплением, где для оценки правильности ответов использовались формальные критерии проверки.

DeepSeek-R1 стала первой рассуждающей моделью, методология обучения которой была опубликована в открытом доступе.

Примеры использования

Генерация ответов на сложные запросы, например, решение математических задач.

Нововведения

Использование методов обучения с подкреплением для обучения процессу рассуждения.
Использование формальных верификаторов для подсчета награды (reward).

Количество параметров: 671B всего, 37B активных.

Автор: Михаил Ким

Теги:deepseek, LLM, NLP, Transformer

Next DeepSeek-V3 »

Previous « Новые рассуждающие модели от OpenAI и Google, open-source-конкурент GPT и Claude

Tags: deepseekLLMNLPTransformer

31.12.2024

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

США усилили контроль над лидирующими ИИ моделями, ученые смогли полностью прочитать античный свиток, не разворачивая его — что произошло в…

06.07.2026

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Агенты, которые самостоятельно планируют свои действия и пользуются внешними инструментами. Модели, способные работать с миллионами токенов. Системы, которые помогают сохранять…

02.07.2026

Новости

Национальный корпус русского языка вырос в шесть раз

Теперь в него входят тексты ВКонтакте — почти 11,3 млрд слов из соцсетей

30.06.2026

DeepSeek-R1

Recent Posts

Жесткая регуляция LLM в США, ИИ полностью прочитал обугленный свиток

От ИИ-агентов до малых языков: куда движется NLP в 2026 году

Национальный корпус русского языка вырос в шесть раз