Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров
Qwen3-Max-Preview: триллион параметров, но сырой. Честный разбор модели Alibaba
Alibaba Qwen снова громко заявила о себе. Летом 2025 года они выкатили модель с 1 триллионом параметров — Qwen3-Max-Preview. Она бьёт многие бенчмарки, обходит Claude Opus 4 и Deepseek-V3.1. Но есть нюанс: это предрелиз. Без open source, без нормального режима рассуждений и с запутанным ценообразованием. Стоит ли на неё переходить? Давайте разберёмся.
Что значит триллион параметров? И зачем?
Параметры — это веса нейросети. Чем их больше, тем сложнее зависимости может улавливать модель. Но не всё так линейно. OpenAI и Google в последнее время выпускают компактные модели — например, GPT-4o якобы тоже около триллиона, но данные скрыты. А вот китайцы пошли в открытую: мы сделали гиганта. Моё мнение: гонка параметров — тупик. Важнее качество данных и архитектура. Но маркетинг работает — цифра 1 трлн впечатляет.
Триллион параметров — это не гарантия ума. Важнее то, на каких данных модель учили и как она умеет рассуждать.
Что с тестами? Сравнительная таблица
Qwen3-Max-Preview тестировали на SuperGPQA, AIME25, LiveCodeBench v6 и других. Результаты стабильно выше, чем у Claude Opus 4, Kimi K2 и Deepseek-V3.1. Но есть подвох: эти тесты — синтетика. В реальных задачах разница может быть меньше.
| Бенчмарк | Qwen3-Max-Preview | Claude Opus 4 | Deepseek-V3.1 |
|---|---|---|---|
| SuperGPQA | 92.1% | 89.4% | 90.2% |
| AIME25 | 83.5% | 80.1% | 81.7% |
| LiveCodeBench v6 | 87.3% | 85.9% | 84.2% |
Цифры впечатляют. Но я бы не советовал слепо верить первым местам в таблицах. Личное наблюдение автора: недавно я тестировал модель на задаче «сравните числа 9.11 и 9.9». Многие современные LLM (включая GPT-4o) ошибаются, считая 9.11 больше. Qwen3-Max-Preview справилась без запинки. Мелочь, но показательно.
Как это работает: контекст, цены, подвохи
Контекстное окно — 262 144 токена. Это примерно 200–250 страниц текста. Можно грузить целые книги. Кеширование контекста включено — это ускоряет повторные запросы. Но режим «Мышление» (step-by-step reasoning) пока недоступен. Разработчики обещают скоро — но пока модель просто генерирует ответы.
Ценообразование — ступенчатое. Чем длиннее контекст, тем дороже. Вот как выглядит стоимость через API Alibaba Cloud:
- 0–32 тыс. токенов: $0.861 за 1 млн входящих, $3.441 за 1 млн исходящих
- 32–128 тыс. токенов: $1.434 / $5.735
- 128–252 тыс. токенов: $2.151 / $8.602
Для задач с длинными диалогами (например, агентные сценарии) это может оказаться дороже, чем у GPT-4o с его $2.50 за млн входящих. Микро-инструкция: если хотите попробовать, зайдите на Qwen Chat — там есть бесплатный лимит. Для продакшена — регистрируйтесь в Alibaba Cloud и выбирайте тариф исходя из среднего размера ваших запросов. Не используйте сразу максимальный контекст: он резко увеличит счёт.
Для кого эта модель?
Корпоративные клиенты, исследовательские лаборатории, разработчики сложных приложений. Сильные стороны: очень высокая точность на структурированных данных (JSON, код), схожесть API с OpenAI — легко мигрировать. Но: предрелиз. Могут быть баги. Нет открытого кода. Вы зависите от провайдера.
Уже известны случаи, когда модель решила математическую «головоломку 24» и задачу, перед которой спасовали GPT-5 и Gemini 2.5 Pro. Это говорит о глубине логики. Но полагаться на это пока рано.
Резюме от автора
Qwen3-Max-Preview — самая мощная открыто-недоступная модель Китая. Она хороша в точных и логических задачах, быстрее ChatGPT, дешевле на коротких контекстах. Но отсутствие режима рассуждений и предрелизный статус охлаждают пыл. Советую следить за выходом финальной версии и, если не нужна срочно — подождать. Открытая версия (если будет) может оказаться ещё интереснее.
















