Когда никто не ошибается: почему рейтинг Эло перестал работать в современных шахматах
Международная федерация заочных шахмат (ICCF) столкнулась с проблемой, которая ставит под сомнение смысл соревнований в их нынешнем виде. В заочных шахматах, где игрокам официально разрешено использовать компьютерные движки для анализа позиций, уровень игры достиг практически абсолютной точности. Следствием этого стали постоянные ничьи: на элитном уровне так заканчивается до 95% партий.
Традиционные рейтинговые системы, такие как Эло, оказались неспособны адекватно оценивать силу игроков в условиях тотального равенства. Это привело к стагнации рейтинговых таблиц и невозможности выявить реального лидера. В ответ на это профессор статистики Гарвардского университета Марк Гликман, автор известной системы Glicko, разработал принципиально новую математическую модель. Его подход предлагает отказаться от линейного восприятия результата и ввести зависимость вероятности ничьей от абсолютной силы соперников.
Архитектура проблемы: почему система Эло устарела
Система рейтингов Арпада Эло, разработанная в середине XX века, построена на модели Брэдли-Терри. Ее ключевой постулат гласит: результат партии зависит исключительно от разницы в рейтингах двух соперников. Если рейтинг игрока А на 200 пунктов выше рейтинга игрока Б, система прогнозирует определенную вероятность победы А (например, 76%).
В этой парадигме ничья рассматривается как промежуточный результат, эквивалентный половине победы и половине поражения. Система Эло предполагает, что вероятность ничьей либо является константой, либо зависит от близости рейтингов соперников друг к другу. Однако она полностью игнорирует абсолютный уровень мастерства. Для формулы Эло ничья в партии двух новичков, совершающих по десять грубых ошибок за игру, математически идентична ничьей в партии двух суперкомпьютеров, играющих идеально.
В реальности эти события имеют совершенно разную природу. У слабых игроков ничья часто является результатом взаимных ошибок, уравновешивающих друг друга. У элитных игроков ничья — это следствие отсутствия ошибок. Когда оба соперника играют безошибочно, партия неизбежно приходит к мирному исходу. Игнорирование этого факта привело к тому, что в заочных шахматах рейтинговая система перестала работать как измерительный инструмент. Разница между игроком с рейтингом 2500 и 2800 стиралась, так как оба они играли вничью с вероятностью, близкой к единице.
Гипотеза Гликмана: сила игрока как фактор ничьей
Марк Гликман предложил расширить классическую модель парных сравнений, введя новые переменные. Его система строится на утверждении, что вероятность ничьей функционально зависит от совокупного мастерства соперников.
В предложенной модели результат партии определяется не только разностью сил, но и их суммой или средним значением. Чем выше средний рейтинг пары, тем выше базовая вероятность ничейного исхода.
Механика процесса описывается следующим образом:
- Низкий рейтинг: игроки играют нестабильно. Вероятность результативного исхода (победа/поражение) высока, так как исход партии решается грубыми ошибками. Модель Гликмана присваивает таким играм низкую вероятность ничьей.
- Высокий рейтинг: игроки (особенно использующие движки) эффективно нейтрализуют угрозы. Способность к защите растет быстрее, чем способность к атаке. Модель Гликмана предсказывает для таких пар высокую вероятность ничьей.
Это меняет подход к начислению очков. Если два слабых игрока сыграли вничью, это неожиданный результат для системы, который сближает их рейтинги. Если же вничью сыграли два чемпиона, система воспринимает это как ожидаемое событие, содержащее мало информации. Следовательно, их рейтинги изменяются незначительно. Это решает проблему волатильности и инфляции рейтингов на высшем уровне.
Асимметрия цвета: преимущество первого хода
Вторым важным аспектом исследования Гликмана стал анализ преимущества игры белыми фигурами. Традиционная статистика фиксирует, что белые побеждают чаще, но обычно это преимущество считается фиксированной величиной для всех игроков.
Гликман проанализировал данные очных турниров US Chess Open и обнаружил, что преимущество белого цвета также коррелирует с силой игрока.
- Слабые игроки не умеют удерживать инициативу первого хода. Их преимущество нивелируется уже в дебюте из-за неточностей.
- Сильные игроки способны трансформировать минимальное дебютное преимущество в долгосрочное позиционное давление.
Статистический анализ показал: чем выше рейтинг игрока, тем выше вероятность его победы белыми (при прочих равных). Математически это выражается через введение дополнительного параметра в уравнение логистической регрессии, который масштабирует «бонус белого цвета» в зависимости от рейтинга.
Однако при внедрении новой системы в ICCF от учета этого фактора было решено отказаться. Причина лежала не в плоскости математики, а в плоскости спортивной этики. Игровое сообщество сочло несправедливой систему, которая заранее приписывает более сильному игроку, играющему белыми, еще большее математическое ожидание победы. В финальной версии алгоритма, принятой федерацией, параметры, отвечающие за преимущество цвета, были обнулены, несмотря на их статистическую значимость.
Байесовский подход и динамика во времени
Для реализации своей модели Гликман использовал байесовский метод пространства состояний. В отличие от классического Эло, где рейтинг — это точечное значение, в системе Гликмана сила игрока описывается как распределение вероятностей (нормальное распределение с параметрами среднего и дисперсии).
Ключевая особенность системы — динамическое изменение неопределенности во времени.
- Случайное блуждание: сила игрока не считается застывшей константой. Она эволюционирует от периода к периоду. Даже если игрок не играет, система увеличивает параметр неопределенности (дисперсию) его рейтинга. Это отражает тот факт, что мы меньше знаем о силе игрока, который давно не садился за доску.
- Фильтрация: для обновления рейтингов используется алгоритм, аппроксимирующий сложные интегралы (через квадратуру Гаусса-Эрмита и метод Ньютона-Рафсона). Это позволяет пересчитывать рейтинги итеративно, период за периодом, без необходимости каждый раз обрабатывать всю историю игр с нуля.
Такой подход позволяет системе быстро реагировать на изменение формы игрока, но при этом сохранять устойчивость при наличии редких случайных результатов.
Результаты внедрения в ICCF
Новая система была протестирована на массиве данных ICCF, охватывающем период с 2016 по 2022 год (около 400 000 партий). Сравнение проводилось с использованием метрики перекрестной энтропии, которая оценивает точность вероятностных прогнозов.
Модель Гликмана показала существенно лучшую предсказательную способность по сравнению с классической системой Эло. Но главным результатом стало исправление структурных перекосов в рейтинговой таблице:
- Устранение инфляции: в старой системе рейтинги топ-игроков необоснованно росли, превышая отметку 3000 пунктов, что не отражало реальной разницы в классе. Новая система скорректировала эти значения, вернув их в реалистичный диапазон.
- Стабилизация: система перестала наказывать элитных игроков снижением рейтинга за серии ничьих с равными соперниками. Поскольку модель теперь ожидает ничью, рейтинг игрока остается стабильным при мирном исходе, что соответствует логике игры на высшем уровне.
Значение для аналитики соревновательных систем
Работа Марка Гликмана демонстрирует переход от простых линейных метрик к сложным вероятностным моделям в оценке компетенций. Это имеет значение не только для шахмат, но и для любой соревновательной среды, где уровень мастерства участников приближается к пределу, а цена ошибки становится критической.
В киберспорте, алгоритмической торговле и системах ранжирования ИИ-агентов наблюдается схожая тенденция: по мере совершенствования стратегий результативность действий снижается, а ничейные или неопределенные исходы становятся нормой. Гликман показал, что в таких системах нельзя использовать универсальную линейку. Инструмент измерения должен адаптироваться к объекту измерения: метрики, работающие для новичков, бесполезны для профессионалов.
Внедрение системы Гликмана в ICCF в 2023 году стало первым случаем, когда крупная спортивная федерация официально признала зависимость вероятности ничьей от силы игры, закрепив этот факт в математическом ядре своих соревнований. Это знаменует конец эпохи Эло и переход к более нюансированной оценке интеллектуального превосходства.
Источник:Journal of Data Science














