Что такое Qwen3 и какие возможности предлагает новая разработка Alibaba

Alibaba представила Qwen3 — новое семейство гибридных моделей ИИ, способных обрабатывать запросы разной сложности с высокой эффективностью.

👁️ 226
Искусственный интеллект Qwen3 от Alibaba
Фото: trashbox

29 апреля компания Alibaba официально представила Qwen3 — новое поколение искусственного интеллекта, доступное на Hugging Face, GitHub и в их чат-боте. В компании утверждают, что модели обладают гибридной природой: при сложных запросах ИИ может тратить время на анализ, тогда как простые запросы обрабатываются мгновенно.

«Такой подход предоставляет пользователям с большей гибкостью настраивать свои бюджеты под определённые задачи».
Официальный блог компании

Разработчики также предложили широкий выбор моделей, включая Qwen3-0.6B, Qwen3-1.7B и Qwen3-4B, а также более крупные модели — до Qwen3-235B-A22B. Это позволяет пользователям выбрать оптимальную модель для конкретных задач, избегая избыточности мощностей.

Некоторые модели Qwen3 используют архитектуру MoE (Mixture of Experts), что позволяет разбивать задачи на компоненты и отправлять их специализированным моделям для выполнения. Это значительно улучшает вычислительную эффективность при обработке запросов. Кроме того, заявлено, что Qwen3 поддерживает 119 языков, включая русский, и был обучен на 36 триллионах токенов.

В процессе обучения моделей использовались данные из учебников, вопросно-ответные пары и сгенерированная информация. Топовая модель Qwen3-235B-A22B по определённым критериям показывает результаты лучше, чем решения от Google и OpenAI. Например, в сложном математическом тесте AIME она обходит o3-mini, хотя и уступает Gemini 2.5 Pro. В тестах на нескольких языках (MultiIF) решение от Alibaba превосходит GPT-4o и DeepSeek-V3.