Alibaba Group выпустила новую линейку языковых моделей Qwen3. Модели представлены в размерах от 0,6 до 32 млрд параметров, а также в архитектуре Mixture of Experts: версия c 30 млрд параметров с 3 млрд активных и флагманская модель c 235 млрд параметров (22 млрд активных).
Флагманская версия опережает DeepSeek-R1 и сопоставима с Google Gemini 2.5 Pro и o3-mini от OpenAI. Все модели поддерживают режим рассуждений и были обучены на 119 языках. Qwen3 доступна для коммерческого использования и уже активно применяется исследователями и разработчиками.