Читать нас в Telegram
Иллюстрация: Женя Родикова

Что такое DeepSeek?

DeepSeek — это большая языковая модель (LLM) с интерфейсом в виде чат-бота. Нейросеть была создана китайской компанией High-Flyer AI (Hangzhou High-Flyer AI Fundamental Research Co.,Ltd.). High-Flyer AI была зарегистрирована в 2019 году, однако ее история начинается гораздо раньше, когда еще в 2008 году группа китайских исследователей занялась разработкой автоматизированного количественного трейдинга с применением методов машинного обучения. Первая сделка, предложенная алгоритмом глубокого обучения, была совершена 21 октября 2016 года. Со временем работа компании привела к созданию DeepSeek — универсальной языковой модели широкого применения.

Почему DeepSeek считают конкурентом ChatGPT, Claude, Gemini, LLAMA и других лидирующих LLM?

У DeepSeek получилась бесплатная, но не менее эффективная нейросеть, которая по многим бенчмаркам (системам оценок моделей) не хуже, а то и превосходит нынешних лидеров в сфере ИИ (ChatGPT, Claude, Gemini, LLAMA). Китайские разработчики существенно снизили стоимость обучения модели и выложили исходный код в открытый доступ. Мы уже говорили, что, например, стоимость обучения DeepSeek-V3, по заявлениям компании, в десятки раз ниже, чем у конкурентов. На обучение модели было затрачено около 5,6 млн долларов во многом за счет оптимизации процедуры обучения, в частности обучения модели в точности floating-point 8 bits. А вот оценочная стоимость обучения ChatGPT-4 составляет 78 млн долларов, говорится в отчете The 2024 AI Index Report.

Оценочная стоимость обучения нейросетевых моделей от Google, OpenAI, Meta* и Microsoft

В нашем недавнем дайджесте мы писали, что на фоне ускорения гонки ИИ Франция и ОАЭ объявили о совместных инвестициях в размере 30–50 млрд евро для создания нового дата-центра.

Архитектура Mixture of Experts

Модели семейства DeepSeek используют архитектуру Mixture of Experts (MoE), которая снижает вычислительные затраты без потери качества. Вместо того чтобы задействовать все параметры одновременно, модель активирует только небольшую часть — например, 5,5% от общего числа. Модель содержит в себе несколько подмоделей, их называют «экспертами». Каждый эксперт умеет обрабатывать только определенные токены (части слова или целые слова) в определенных контекстах. Для каждого запроса специальная подмодель (gating) определяет набор экспертов, которые необходимы для его обработки. Всего в моделях DeepSeek 256 экспертов, но во время генерации ответа используется лишь 9: один из них используется при любых запросах, а остальные динамически определяются в зависимости от запроса

Цензура

DeepSeek за рубежом не подвергается жесткой цензуре, что позволяет пользователям обсуждать темы, которые могут быть ограничены в других системах. Однако когда дело касается китайской политики, цензура все же присутствует. Например, бот не дает комментариев по поводу «событий 4 июня»* и отправляет сообщения об ошибках.

Что за события 4 июня?

4 июня 1989 года Народно-освободительная армия Китая с применением огнестрельного оружия и бронетехники подавила студенческие протесты на площади Тяньаньмэнь в Пекине, что привело к многочисленным жертвам.

Цензурное ограничение в запросах к DeepSeek

Как пользоваться DeepSeek

Перейдите на главную страницу сайта www.deepseek.com и нажмите кнопку Start now.
Выберите удобный способ регистрации: с помощью электронной почты или через Google-аккаунт.

Стартовая страница DeepSeek

Мобильное приложение для Android и iOS

Приложение DeepSeek на смартфон также доступно без региональных ограничений. Вы можете скачать его в App Store, Google Play или с помощью QR-кода на сайте (кнопка Get DeepSeek App на главной странице).

Могут ли пользователи из России пользоваться DeepSeek?

DeepSeek принимает пользователей с российскими IP-адресами и не требует использования сторонних приложений. 

API DeepSeek 

Чат-бот и само приложение доступны бесплатно, однако доступ к API DeepSeek оплачивается отдельно: от $0,14 за миллион токенов (минимальная текстовая единица). Итоговая стоимость и скорость ответа зависят от выбранной модели и настроек кеширования контента.

DeepSeek можно использовать локально на вашем ПК

Нейросетью DeepSeek можно пользоваться локально на ПК с помощью бесплатной программы Ollama.

Для этого нужно скачать Ollama с официального сайта, выбрать версию для своей ОС (MacOS, Linux или Windows), установить ее и проверить корректность установки через команду ollama -v в терминале.

Затем на сайте Ollama во вкладке «Models» выберите модель deepseek-r1: подберите версию в зависимости от характеристик вашего компьютера (например, модель 7b требует от 3,5 Гб ОЗУ и 12 Гб видеопамяти), и запустите её командой ollama run deepseek-r1:7b.

Важно понимать, что локальные версии таких моделей — меньше и проще тех, что доступны в приложениях, а потому «глупее». Они используют ресурсы пользовательского ПК, имеют меньше параметров и более простую архитектуру. Такие модели удобны для автономного использования, но для сложных задач и обработки больших объемов данных лучше использовать серверные решения.

Для разработчиков открытый код дает свободу кастомизации: можно создать собственный интерфейс или адаптировать модель под конкретные задачи.

Что умеет DeepSeek?

Режим DeepThink (глубокое мышление)

DeepThink — это режим рассуждения, подобный режиму «Обоснуй» у GPT-o1 и o1-mini. DeepThink активирует модель R1, которой можно пользоваться без ограничений по лимитам и которая не требует подписки, как у конкурентов.

Кнопка, активирующая режим DeepThink в модели R1

Рассуждения DeepSeek, по сравнению с ChatGPT, выглядят более детальными.

На скриншотах выше показана меньшая часть рассуждений DeepSeek. На рассуждение модель потратила 169 секунд, тогда как ChatGPT «думала» над этим же вопросом всего 25 секунд.

Рассуждения ChatGPT выглядят гораздо проще и неформальнее, так как модель показывает не полноценные  рассуждения, а их упрощенную версию. 

Поиск в интернете при генерации ответа

DeepSeek также имеет режим Search, что позволяет находить актуальную информацию в интернете. Однако на данный момент этот режим не работает.

Отдельного внимания заслуживает способность модели к фактчекингу, который можно воспроизводить без ограничений в лимитах (по сравнению с ChatGPT).

Фактчек отрывка из статьи с названием «Технологии будущего: как они преобразят жизнь человека в следующие несколько лет»

Работа с документами

В рабочем поле DeepSeek можно ввести текстовый запрос и добавить до 50 файлов размером до 100 МБ каждый. Поддерживаются форматы DOCX, TXT, JSON, CSV, XLSX, PDF, PNG, PPTX, но в изображениях и презентациях нейросеть распознает только текст. 

Может ли DeepSeek генерировать изображения?

Модели V3 и R1 не могут рисовать изображения, однако у DeepSeek есть специальная модель Janus Pro. Это продвинутая мультимодальная языковая модель от DeepSeek, усовершенствованная версия оригинальной Janus. Ее архитектура построена так, чтобы модель была способна и анализировать изображения, и генерировать их. Janus Pro доступна в двух версиях: 1B и 7B. Главное нововведение Janus Pro — авторегрессионная модель LlamaGen. Главное отличие этой архитектуры от диффузионных моделей в том, что она работает по принципам LLM и предсказывает следующий токен на основе предыдущих. 

Какие ограничения есть у DeepSeek?

  • Качество генерации текстов. DeepSeek уступает ChatGPT в плане естественности стиля и глубины ответов, особенно по сложным темам.
  • Поддержка языков. Хотя DeepSeek поддерживает русский, ChatGPT лучше справляется с пониманием сложных фраз и контекстных нюансов.
  • Загрузка PDF-файлов. С ростом популярности DeepSeek возникли проблемы с распознаванием PDF-документов. Пользователи стали жаловаться, что не могут загрузить свои файлы, и платформа полностью прекратила поддержку PDF и других документов как в веб-версии, так и в мобильном приложении.
  • Политическая цензура. DeepSeek имеет ограничения по политически чувствительным вопросам, связанным с Китаем, такими как события на площади Тяньаньмэнь, независимость Тайваня и положение уйгуров. Система может избегать ответов или предоставлять информацию в соответствии с официальной позицией китайского правительства.
  • Работа со ссылками. DeepSeek не всегда корректно работает со ссылками и может давать неточные результаты при отсутствии доступа в интернет.
  • Ограничения доступа. В периоды высокой нагрузки доступ к поиску может быть ограничен.

DeepSeek создан на основе советских разработок?

В утреннем выпуске новостей 2 февраля 2025 года на канале «Россия 1» было сказано, что основой для чат-бота DeepSeek стал программный код, разработанный в СССР в 1985 году.  История была выдумана сатирическим изданием ИА «Панорама» 29 января. Утверждалось, что глава компании Лян Вэньфэн якобы рассказал американскому блогеру, будто код DeepSeek был создан «на базе системы ОГАС академика Глушкова» в 1985 году («Системный Блокъ» подробно рассказывал о системе ОГАС — нереализованном проекте «советского интернета»).

Кадр из эфира «Россия 1», во время которого ведущий зачитал фейковую новость о связи DeepSeek с ОГАС

Эта информация была подхвачена СМИ и технологическими пабликами, но является чистым вымыслом. Никакого отношения к ОГАС DeepSeek не имеет. В основе модели — трансформерная архитектура, которая была придумана в 2016–2017 годах. 

DeepSeek не работает! Что делать?

Server is busy 

Если вы столкнулись с ошибкой «Сервер занят» в DeepSeek, попробуйте следующие шаги:

  1. Обновите страницу или приложение. Для браузера нажмите F5 или Ctrl + R (Windows) или Cmd + R (Mac). Для мобильных пользователей: закройте и откройте приложение.
  2. Выйдите из аккаунта и войдите снова. Это обновит вашу сессию и устранит временные сбои.
  3. Проверьте интернет-соединение. Убедитесь, что ваш Wi-Fi или мобильные данные работают корректно, проведя тест скорости.
  4. Проверьте статус серверов DeepSeek. Посетите страницу статуса или используйте DownDetector для проверки сбоев.
  5. Отключите VPN или прокси. Это поможет избежать перегрузки серверов и блокировок.
  6. Свяжитесь с поддержкой DeepSeek. Если проблема не решена, предоставьте информацию о кодах ошибок и вашем устройстве для получения помощи.

Не приходит код

Некоторые пользователи могут столкнуться с проблемами еще при регистрации в DeepSeek. Хотя проще всего войти через аккаунт Google, это не всегда возможно.

Если не приходит код подтверждения, попробуйте следующие действия:

  • Проверьте подключение к Wi-Fi или проводному интернету.
  • Загляните в папку «Спам». Иногда письмо с кодом попадает туда.
  • Подождите 10–15 минут, так как задержки могут возникать из-за загруженности серверов.
  • Запросите код снова, если такая функция доступна.
  • Убедитесь, что адрес электронной почты указан правильно.

Если эти шаги не помогают, обратитесь в техническую поддержку DeepSeek через сайт или мобильное приложение, выбрав опцию «Свяжитесь с нами» в настройках.

Не загружаются файлы 

Недавно пользователи DeepSeek, начали замечать сбои в загрузке PDF-файлов и изображений. DeepSeek был ценен для специалистов и студентов благодаря технологии оптического распознавания текста (OCR), которая позволяла быстро извлекать текст из сканов, конвертировать их в удобные форматы и упрощать поиск нужной информации.

К сожалению, платформа приостановила поддержку PDF и других файлов. Это коснулось как веб-версии, так и мобильных приложений.

*Meta признана в РФ экстремистской организацией