Инженер нашёл транзисторы в процессоре Pentium, которые 30 лет назад стоили Intel $475 миллионов
В 1994 году дефектный чип Intel Pentium стоил компании почти полмиллиарда долларов и стал крупнейшим кризисом в истории полупроводниковой отрасли. Спустя 30 лет инженер и историк микроэлектроники Кен Ширрифф провел уникальное обратное проектирование кристалла и выяснил, что реальный масштаб фатальной «ошибки FDIV» был значительно больше, чем считалось ранее.
Микроскопическое расследование: как нашли корень проблемы
Используя оптический микроскоп, Ширрифф изучил структуру программируемой логической матрицы (PLA) процессора Pentium на архитектуре P5. В отличие от современных CPU с десятками миллиардов транзисторов, кристалл 800-нм техпроцесса содержал лишь 3,1 миллиона элементов, что позволило визуально идентифицировать каждый блок. Внимание эксперта было приковано к модулю операций с плавающей запятой. В основе быстродействия Pentium лежал алгоритм деления SRT (SRT Division), позволявший обрабатывать по два бита за такт. Для его корректной работы на кристалле размещалась справочная таблица из 2048 ячеек, расположенных в 112 строках. Каждая ячейка хранила одно из пяти значений: «-2», «-1», «0», «1» или «2». Само значение определялось физическим наличием или отсутствием транзистора в конкретной точке.Системная ошибка: не пять, а шестнадцать пустых ячеек
Ранее считалось, что катастрофу вызвало отсутствие транзисторов всего в пяти записях таблицы. Из-за этого процессор считывал «0» вместо необходимой «2», что приводило к неверным результатам при делении чисел с плавающей точкой. Однако исследование Ширриффа показало, что пустых ячеек было в три раза больше — целых 16. По словам инженера, 11 из этих 16 пропусков не приводили к сбоям «исключительно по чистому везению». Это означает, что архитектура чипа имела скрытый запас прочности, но даже он не спас от пяти критических точек, которые и вызвали эффект домино.Цена ошибки: от отрицания до рекордного убытка
Первым на проблему натолкнулся профессор математики Томас Найсли, однако реакция Intel была пренебрежительной. В корпорации заявили, что ошибка проявляется лишь раз в 27 тысяч лет при обычной работе пользователя. Независимое тестирование в IBM опровергло эти расчеты: выяснилось, что сбой может происходить каждые 24 дня. После того как IBM остановила продажи компьютеров на базе Pentium, Intel была вынуждена объявить беспрецедентный отзыв всех процессоров. Убыток компании составил 475 миллионов долларов — сумма, эквивалентная миллиарду долларов с поправкой на инфляцию. Сам механизм исправления оказался удивительно простым и элегантным. В ответ на скандал инженеры Intel заполнили все пустующие и неиспользуемые записи в таблице PLA значением «2». Это решение не требовало изменения топологии кристалла и мгновенно решило проблему, однако репутационный ущерб для «синего гиганта» оставался колоссальным еще многие годы. Этот случай стал поворотным моментом для всей индустрии. Он продемонстрировал, что даже при формально корректном математическом алгоритме физическая реализация на уровне транзисторов может содержать фатальные уязвимости. Исследование Ширриффа, спустя три десятилетия, не только закрывает исторический пробел, но и служит напоминанием о хрупкости сложных систем: одна отсутствующая деталь на кремниевой пластине способна обрушить рынок и изменить стратегию крупнейших корпораций.Опубликовано: Мировое обозрение Источник















