Google представила свой самый мощный ИИ-процессор Ironwood — до 4,6 квадриллиона операций в секунду
Новый ИИ-чип Google Ironwood, анонсированный на конференции Cloud Next, знаменует собой не просто очередное обновление линейки процессоров, а стратегический разворот в сторону эффективности работы уже обученных моделей. В то время как индустрия сосредоточена на гонке за сырой производительностью для обучения, Google делает ставку на «инференс» — этап, где ИИ-модели приносят реальную коммерческую пользу, и где, по мнению аналитиков, в ближайшие годы возникнет основное узкое место.
Седьмое поколение TPU: ставка на энергоэффективность и специализацию
Железо, получившее название Ironwood, является первым тензорным процессором (TPU) от Google, который с самого начала проектировался исключительно для задач инференса. Это принципиально отличает его от предшественников, которые были универсальными. Как заявил вице-президент Google Cloud Амин Вахдат, новый чип стал «самым мощным, производительным и энергоэффективным» в истории компании. Ключевой акцент сделан не на пиковых терафлопсах, а на реальной скорости обработки запросов при минимальном энергопотреблении.
Архитектурные решения для облачных нагрузок
Ключевым нововведением стало усовершенствованное ядро SparseCore. Этот специализированный блок отвечает за обработку разреженных данных, которые доминируют в рекомендательных системах и алгоритмах ранжирования. Именно эти алгоритмы лежат в основе поисковой выдачи, ленты рекомендаций YouTube и персонализированной рекламы — основных источников дохода Google. По сути, компания создала чип, заточенный под свои ключевые бизнес-процессы.
- Производительность: Каждый процессор Ironwood выдает 4614 Тфлопс (триллионов операций в секунду).
- Память: Объем выделенной оперативной памяти составляет 192 Гбайт на чип с пропускной способностью 7,4 Тбит/с.
- Масштабирование: Базовая конфигурация включает сервер из 256 процессоров. Максимальная сборка — кластер из 9216 чипов, чья совокупная мощность достигает 42,5 Экзафлопс.
Новая архитектура облачных вычислений: AI Hypercomputer
Ironwood станет основой для модульного вычислительного кластера Google Cloud под названием AI Hypercomputer. Компания уходит от модели продажи отдельных «железок» к поставке интегрированных решений, где программное обеспечение, сетевая инфраструктура и сами чипы работают как единый организм. Это должно минимизировать задержки при перемещении данных между ядрами и памятью, что критически важно для задач реального времени.
Анонс Ironwood происходит на фоне острой конкуренции в сегменте проприетарных ИИ-ускорителей. Доминирование Nvidia на рынке обучения моделей неоспоримо, но в сфере инференса картина иная. Amazon уже давно использует собственные чипы Trainium и Inferentia в AWS, а Microsoft внедряет процессоры Cobalt 100 в Azure. Google, обладая уникальным опытом эксплуатации TPU в своих поисковых системах и YouTube, пытается конвертировать этот опыт в коммерческое преимущество для облачных клиентов.
С точки зрения рыночной динамики, появление Ironwood может изменить правила игры для компаний, которые уже развернули крупные ИИ-модели и теперь ищут способы снизить операционные расходы на их обслуживание. Энергоэффективность и специализация под конкретные типы данных (разреженные матрицы) делают предложение Google особенно привлекательным для секторов электронной коммерции и медиа, где рекомендательные системы являются ядром бизнеса. Однако успех Ironwood будет зависеть не только от характеристик, но и от того, насколько легко существующие клиенты Google Cloud смогут мигрировать свои инференс-нагрузки на новую архитектуру, не переписывая при этом весь код.














