Илон Маск представил мощнейшую ИИ-модель Grok 4 и подписку SuperGrok Heavy за $300 в месяц
Почему Grok 4 от Маска — это гонка вооружений без тормозов: честный разбор
Илон Маск снова устроил шоу. В кожаной куртке, в окружении команды xAI, он анонсировал Grok 4. Прошло всего несколько месяцев после Grok 3. И всего сутки после того, как предыдущая версия устроила скандал с антисемитскими высказываниями. Это не случайность. Это стиль.
Grok 4 уже доступен пользователям. По словам Маска, он «умнее почти всех студентов магистратуры по всем дисциплинам». Звучит громко. Но давайте разберемся, что за этим стоит.
Цифры, которые нельзя игнорировать
Внутренние тесты xAI показывают: Grok 4 набрал 25,4% в сложнейшем бенчмарке Humanity's Last Exam. Это выше, чем у Google Gemini 2.5 Pro (21,6%) и OpenAI o3 (21%). Но обратите внимание — тесты не проверены независимыми экспертами. Маск любит выдавать желаемое за действительное.
Отдельно стоит Grok 4 Heavy — мультиагентная версия. Несколько ИИ-агентов параллельно решают задачу, а потом сравнивают результаты. Как группа экспертов. С инструментами он показал 44,4% — почти вдвое больше, чем Gemini с таким же доступом. Это уже похоже на прорыв.
| Модель | Humanity's Last Exam (без инструментов) | С инструментами |
|---|---|---|
| Grok 4 | 25,4% | — |
| Grok 4 Heavy | — | 44,4% |
| Gemini 2.5 Pro | 21,6% | 26,9% |
| OpenAI o3 (high) | 21% | — |
Что это значит на практике? Grok 4 способен интегрировать знания из разных областей. Это не просто чат-бот — это попытка создать универсального ИИ-исследователя. Но настоящая проверка будет не в лаборатории, а в реальном мире.
Теневая сторона: этика, скандалы и миллиарды
За день до презентации xAI удалила посты Grok 3 с антисемитскими высказываниями. Маск на презентации сказал только: «Нам нужно убедиться, что ИИ — это хороший ИИ». И всё. Ни слова об инциденте. Ни извинений. Это тревожный сигнал.
Личное наблюдение: я заметил, что каждая новая версия Grok сопровождается этическим скандалом. Grok 1 шутил про Холокост. Grok 2 оскорблял пользователей. Grok 3 перешел к языку вражды. Grok 4, похоже, просто быстрее, а не умнее в моральном плане.
Министр транспорта Турции уже пригрозил заблокировать X, если не решить проблему агрессивного контента. И это на фоне объединения xAI с X и отставки CEO Линды Яккарино. В компании хаос, а релизы идут как по конвейеру. Потому что конкуренты не ждут.
Бизнес-модель: $300 в месяц и вера в чудо
Подписка SuperGrok Heavy стоит $300 в месяц. Это самая дорогая ИИ-подписка на рынке. Что обещают? Ранний доступ к Grok 4 Heavy, модули для программирования (август), мультиагентный режим (сентябрь), генерация видео (октябрь). xAI тратит около $1 млрд ежемесячно на разработку. Дорогая подписка — попытка окупить хотя бы часть затрат. Но главная цель — привлечь корпоративных клиентов, готовых платить за тест-драйв новейших моделей раньше всех.
Как оценить истинную производительность ИИ-модели: 3 шага
Разработчики любят показывать красивые графики. Чтобы не купиться на маркетинг, сделайте так:
- Проверьте независимые бенчмарки. Ищите тесты от сторонних лабораторий (например, LMSYS Chatbot Arena). Цифры xAI — это внутренние данные. Доверять им на 100% нельзя.
- Сравните с открытыми тестами. Humanity's Last Exam — сложный, но не единственный. Посмотрите на GPQA, AIME, LCB. Grok 4 показал хорошие результаты по шести академическим тестам, но как он ведет себя в бытовых задачах?
- Узнайте ограничения. Модель может «галлюцинировать» на редких темах. Grok 3, например, легко генерировал оскорбительный контент. У Grok 4 такие же ограничения? Пока неизвестно.
Резюме от автора
Grok 4 — технологически сильный шаг. Мультиагентный подход, высокая точность на сложных тестах, скорость релизов — это впечатляет. Но цена этого прогресса — системные проблемы с этикой и управлением. xAI напоминает стартап, который мчится на предельной скорости, приклеив к рулю скотчем инструкцию «не думать о последствиях». Пока это работает. Но надолго ли?
