ИИ Google Gemini отказался играть в шахматы с древней приставкой Atari 2600, испугавшись поражения

15 июл 2025, 15:12

Почему Google Gemini струсил перед Atari 2600: честный разбор

Инженер Роберт Карузо устроил шахматный турнир между древней консолью и современными чат-ботами. Сначала выяснилось, что OpenAI ChatGPT и Microsoft Copilot продули старому игровому автомату. Затем пришла очередь Google Gemini. Но Gemini поступил хитрее — он просто отказался играть. Почему? И что это говорит о реальных возможностях ИИ? Давайте разберемся без рекламных розовых очков.

Как это работает: матч, которого не было

В качестве соперника использовался симулятор Atari 2600 с процессором на 1,19 МГц и 128 Кбайт оперативной памяти. Шахматный движок Atari Chess был написан в 1979 году. Казалось бы — копейки против современных нейросетей. Но факт: и ChatGPT, и Copilot сначала хвастались легкой победой, а потом слили партию. Почему? Большие языковые модели не умеют просчитывать шахматные комбинации. Они лишь имитируют понимание, подбирая вероятные ответы. Atari действовал по четкому алгоритму — и этого хватило.

Gemini, увидев результаты предыдущих матчей, заявил: «почти наверняка победит». Но когда инженер указал, что оппоненты тоже так говорили — и проиграли, — поведение резко изменилось. Gemini признал, что переоценил свои силы и в итоге сказал: «самое эффективное и разумное решение — отменить матч».

Это не просто забавный курьез. Речь о способности ИИ оценивать собственную компетентность — или ее отсутствии.

Сравнительная таблица: кто есть кто

Система	Тип	Объем памяти (условно)	Результат против Atari Chess
Atari 2600 Video Chess	Детерминированный движок	128 Кбайт	— (победа над ChatGPT и Copilot)
OpenAI ChatGPT	Языковая модель (LLM)	Гигабайты весов	Проиграл
Microsoft Copilot	Языковая модель (LLM)	Гигабайты весов	Проиграл
Google Gemini	Мультимодальная LLM	Гигабайты весов	Отказ от игры

Цифры говорят сами за себя. Мощнейшие нейросети с миллиардами параметров не могут обыграть программу, написанную 45 лет назад. Это не недостаток — это другое назначение. Языковые модели созданы для текста, а не для логики.

Личное наблюдение: чат-боты часто врут о своих силах

Недавно я заметил, что большинство людей относятся к ИИ как к всезнающему гуру. Спросишь ChatGPT: «Ты умеешь считать сложные проценты?» — ответит: «Конечно!» А потом выдаст бред. То же самое с шахматами. Gemini в этом смысле показал редкую черту — он осознал, что не справится, и отказался. Но отказ — это не победа. Это признак того, что модель не предназначена для таких задач. Если бы пользователь полагался на Gemini как на шахматного советника, он бы проиграл.

Пошаговый совет: как проверить ИИ на честность

Задайте нейросети задачу, где ответ можно проверить эталоном (например, шахматная задача с известным решением).
Попросите модель оценить сложность задачи до того, как она начнет решать.
Если ИИ обещает легкую победу, но не может объяснить стратегию — будьте настороже.
Сравните ответ с результатом простого алгоритма или калькулятора.
Потребуйте указать границы своей компетенции. Большинство моделей этого не делают — значит, они ненадежны.

Мнение автора: ИИ — не оракул, а инструмент

Эксперимент показал главное: языковые модели не умеют думать. Они угадывают. И пока мы не научимся встраивать в них механизмы самопроверки (как в том же Atari Chess), доверять им в критических сценариях — опасно. Исследователь, комментируя ситуацию, сказал: «Чтобы ИИ оставался крепким инструментом, а не бесконтрольным оракулом». И это абсолютно верно. Gemini хотя бы проявил «разумность», отступив. ChatGPT и Copilot — переоценили себя и проиграли. Кому из них вы доверите управление дроном или медицинскую диагностику?

Резюме: Не верьте нейросетям на слово. Тестируйте их в реальных условиях. А Atari 2600 — напоминание, что иногда старый алгоритм надежнее модной нейронки.

Опубликовано: Мировое обозрение Источник