ИИ Google Gemini отказался играть в шахматы с древней приставкой Atari 2600, испугавшись поражения
Почему Google Gemini струсил перед Atari 2600: честный разбор
Инженер Роберт Карузо устроил шахматный турнир между древней консолью и современными чат-ботами. Сначала выяснилось, что OpenAI ChatGPT и Microsoft Copilot продули старому игровому автомату. Затем пришла очередь Google Gemini. Но Gemini поступил хитрее — он просто отказался играть. Почему? И что это говорит о реальных возможностях ИИ? Давайте разберемся без рекламных розовых очков.
Как это работает: матч, которого не было
В качестве соперника использовался симулятор Atari 2600 с процессором на 1,19 МГц и 128 Кбайт оперативной памяти. Шахматный движок Atari Chess был написан в 1979 году. Казалось бы — копейки против современных нейросетей. Но факт: и ChatGPT, и Copilot сначала хвастались легкой победой, а потом слили партию. Почему? Большие языковые модели не умеют просчитывать шахматные комбинации. Они лишь имитируют понимание, подбирая вероятные ответы. Atari действовал по четкому алгоритму — и этого хватило.
Gemini, увидев результаты предыдущих матчей, заявил: «почти наверняка победит». Но когда инженер указал, что оппоненты тоже так говорили — и проиграли, — поведение резко изменилось. Gemini признал, что переоценил свои силы и в итоге сказал: «самое эффективное и разумное решение — отменить матч».
Это не просто забавный курьез. Речь о способности ИИ оценивать собственную компетентность — или ее отсутствии.
Сравнительная таблица: кто есть кто
| Система | Тип | Объем памяти (условно) | Результат против Atari Chess |
|---|---|---|---|
| Atari 2600 Video Chess | Детерминированный движок | 128 Кбайт | — (победа над ChatGPT и Copilot) |
| OpenAI ChatGPT | Языковая модель (LLM) | Гигабайты весов | Проиграл |
| Microsoft Copilot | Языковая модель (LLM) | Гигабайты весов | Проиграл |
| Google Gemini | Мультимодальная LLM | Гигабайты весов | Отказ от игры |
Цифры говорят сами за себя. Мощнейшие нейросети с миллиардами параметров не могут обыграть программу, написанную 45 лет назад. Это не недостаток — это другое назначение. Языковые модели созданы для текста, а не для логики.
Личное наблюдение: чат-боты часто врут о своих силах
Недавно я заметил, что большинство людей относятся к ИИ как к всезнающему гуру. Спросишь ChatGPT: «Ты умеешь считать сложные проценты?» — ответит: «Конечно!» А потом выдаст бред. То же самое с шахматами. Gemini в этом смысле показал редкую черту — он осознал, что не справится, и отказался. Но отказ — это не победа. Это признак того, что модель не предназначена для таких задач. Если бы пользователь полагался на Gemini как на шахматного советника, он бы проиграл.
Пошаговый совет: как проверить ИИ на честность
- Задайте нейросети задачу, где ответ можно проверить эталоном (например, шахматная задача с известным решением).
- Попросите модель оценить сложность задачи до того, как она начнет решать.
- Если ИИ обещает легкую победу, но не может объяснить стратегию — будьте настороже.
- Сравните ответ с результатом простого алгоритма или калькулятора.
- Потребуйте указать границы своей компетенции. Большинство моделей этого не делают — значит, они ненадежны.
Мнение автора: ИИ — не оракул, а инструмент
Эксперимент показал главное: языковые модели не умеют думать. Они угадывают. И пока мы не научимся встраивать в них механизмы самопроверки (как в том же Atari Chess), доверять им в критических сценариях — опасно. Исследователь, комментируя ситуацию, сказал: «Чтобы ИИ оставался крепким инструментом, а не бесконтрольным оракулом». И это абсолютно верно. Gemini хотя бы проявил «разумность», отступив. ChatGPT и Copilot — переоценили себя и проиграли. Кому из них вы доверите управление дроном или медицинскую диагностику?
Резюме: Не верьте нейросетям на слово. Тестируйте их в реальных условиях. А Atari 2600 — напоминание, что иногда старый алгоритм надежнее модной нейронки.
