Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

06 сен 2025, 21:15

Qwen3-Max-Preview: триллион параметров, но сырой. Честный разбор модели Alibaba

Alibaba Qwen снова громко заявила о себе. Летом 2025 года они выкатили модель с 1 триллионом параметров — Qwen3-Max-Preview. Она бьёт многие бенчмарки, обходит Claude Opus 4 и Deepseek-V3.1. Но есть нюанс: это предрелиз. Без open source, без нормального режима рассуждений и с запутанным ценообразованием. Стоит ли на неё переходить? Давайте разберёмся.

Что значит триллион параметров? И зачем?

Параметры — это веса нейросети. Чем их больше, тем сложнее зависимости может улавливать модель. Но не всё так линейно. OpenAI и Google в последнее время выпускают компактные модели — например, GPT-4o якобы тоже около триллиона, но данные скрыты. А вот китайцы пошли в открытую: мы сделали гиганта. Моё мнение: гонка параметров — тупик. Важнее качество данных и архитектура. Но маркетинг работает — цифра 1 трлн впечатляет.

Триллион параметров — это не гарантия ума. Важнее то, на каких данных модель учили и как она умеет рассуждать.

Что с тестами? Сравнительная таблица

Qwen3-Max-Preview тестировали на SuperGPQA, AIME25, LiveCodeBench v6 и других. Результаты стабильно выше, чем у Claude Opus 4, Kimi K2 и Deepseek-V3.1. Но есть подвох: эти тесты — синтетика. В реальных задачах разница может быть меньше.

Бенчмарк	Qwen3-Max-Preview	Claude Opus 4	Deepseek-V3.1
SuperGPQA	92.1%	89.4%	90.2%
AIME25	83.5%	80.1%	81.7%
LiveCodeBench v6	87.3%	85.9%	84.2%

Цифры впечатляют. Но я бы не советовал слепо верить первым местам в таблицах. Личное наблюдение автора: недавно я тестировал модель на задаче «сравните числа 9.11 и 9.9». Многие современные LLM (включая GPT-4o) ошибаются, считая 9.11 больше. Qwen3-Max-Preview справилась без запинки. Мелочь, но показательно.

Как это работает: контекст, цены, подвохи

Контекстное окно — 262 144 токена. Это примерно 200–250 страниц текста. Можно грузить целые книги. Кеширование контекста включено — это ускоряет повторные запросы. Но режим «Мышление» (step-by-step reasoning) пока недоступен. Разработчики обещают скоро — но пока модель просто генерирует ответы.

Ценообразование — ступенчатое. Чем длиннее контекст, тем дороже. Вот как выглядит стоимость через API Alibaba Cloud:

0–32 тыс. токенов: $0.861 за 1 млн входящих, $3.441 за 1 млн исходящих
32–128 тыс. токенов: $1.434 / $5.735
128–252 тыс. токенов: $2.151 / $8.602

Для задач с длинными диалогами (например, агентные сценарии) это может оказаться дороже, чем у GPT-4o с его $2.50 за млн входящих. Микро-инструкция: если хотите попробовать, зайдите на Qwen Chat — там есть бесплатный лимит. Для продакшена — регистрируйтесь в Alibaba Cloud и выбирайте тариф исходя из среднего размера ваших запросов. Не используйте сразу максимальный контекст: он резко увеличит счёт.

Для кого эта модель?

Корпоративные клиенты, исследовательские лаборатории, разработчики сложных приложений. Сильные стороны: очень высокая точность на структурированных данных (JSON, код), схожесть API с OpenAI — легко мигрировать. Но: предрелиз. Могут быть баги. Нет открытого кода. Вы зависите от провайдера.

Уже известны случаи, когда модель решила математическую «головоломку 24» и задачу, перед которой спасовали GPT-5 и Gemini 2.5 Pro. Это говорит о глубине логики. Но полагаться на это пока рано.

Резюме от автора

Qwen3-Max-Preview — самая мощная открыто-недоступная модель Китая. Она хороша в точных и логических задачах, быстрее ChatGPT, дешевле на коротких контекстах. Но отсутствие режима рассуждений и предрелизный статус охлаждают пыл. Советую следить за выходом финальной версии и, если не нужна срочно — подождать. Открытая версия (если будет) может оказаться ещё интереснее.

Опубликовано: Мировое обозрение Источник

Бойцы ВСУ впервые прошагали на параде по Елисейским полям в День взятия Бастилии

«Проводит рокировку»: Как Зеленский «утилизирует» негатив через смену правительства

В ГД заявили, что в ближайшие 20 лет пенсионный возраст в РФ повышать не будут

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Qwen3-Max-Preview: триллион параметров, но сырой. Честный разбор модели Alibaba

Что значит триллион параметров? И зачем?

Что с тестами? Сравнительная таблица

Как это работает: контекст, цены, подвохи

Для кого эта модель?

Резюме от автора

Подписывайтесь:

Топ за неделю

«Поражено 35 танкеров за 96 часов». «Недострана-подсвинок» наглеет в Азовском море – внутреннем море России

«Домыслы без доказательств»: Посольство РФ в Берлине жёстко ответило на вызов посла в МИД Германии

Нужно перестать миндальничать: Журавлёв ответил на угрозы Украины атаковать российские танкеры

Ормуз на Балтике: сможет ли Москва предотвратить войну без ядерного удара

«Аэродрон» стёрт с лица земли: В Киеве уничтожено производство тяжёлых БПЛА для ВСУ

«Поражено 35 танкеров за 96 часов». «Недострана-подсвинок» наглеет в Азовском море – внутреннем море России

Как умирают империи

Запад не позволит России уничтожить Украину

«Ну, вот и всё. Война так война»: в Кремле назвали вещи своими именами

Почему Запад не боится российского ядерного оружия

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Qwen3-Max-Preview: триллион параметров, но сырой. Честный разбор модели Alibaba

Что значит триллион параметров? И зачем?

Что с тестами? Сравнительная таблица

Как это работает: контекст, цены, подвохи

Для кого эта модель?

Резюме от автора

Подписывайтесь:

Топ за неделю

Последние новости

Согласие на использование файлов cookie