Google представила свой самый мощный ИИ-процессор Ironwood — до 4,6 квадриллиона операций в секунду

09 апр 2025, 23:19

Новый ИИ-чип Google Ironwood, анонсированный на конференции Cloud Next, знаменует собой не просто очередное обновление линейки процессоров, а стратегический разворот в сторону эффективности работы уже обученных моделей. В то время как индустрия сосредоточена на гонке за сырой производительностью для обучения, Google делает ставку на «инференс» — этап, где ИИ-модели приносят реальную коммерческую пользу, и где, по мнению аналитиков, в ближайшие годы возникнет основное узкое место.

Седьмое поколение TPU: ставка на энергоэффективность и специализацию

Железо, получившее название Ironwood, является первым тензорным процессором (TPU) от Google, который с самого начала проектировался исключительно для задач инференса. Это принципиально отличает его от предшественников, которые были универсальными. Как заявил вице-президент Google Cloud Амин Вахдат, новый чип стал «самым мощным, производительным и энергоэффективным» в истории компании. Ключевой акцент сделан не на пиковых терафлопсах, а на реальной скорости обработки запросов при минимальном энергопотреблении.

Архитектурные решения для облачных нагрузок

Ключевым нововведением стало усовершенствованное ядро SparseCore. Этот специализированный блок отвечает за обработку разреженных данных, которые доминируют в рекомендательных системах и алгоритмах ранжирования. Именно эти алгоритмы лежат в основе поисковой выдачи, ленты рекомендаций YouTube и персонализированной рекламы — основных источников дохода Google. По сути, компания создала чип, заточенный под свои ключевые бизнес-процессы.

Производительность: Каждый процессор Ironwood выдает 4614 Тфлопс (триллионов операций в секунду).
Память: Объем выделенной оперативной памяти составляет 192 Гбайт на чип с пропускной способностью 7,4 Тбит/с.
Масштабирование: Базовая конфигурация включает сервер из 256 процессоров. Максимальная сборка — кластер из 9216 чипов, чья совокупная мощность достигает 42,5 Экзафлопс.

Новая архитектура облачных вычислений: AI Hypercomputer

Ironwood станет основой для модульного вычислительного кластера Google Cloud под названием AI Hypercomputer. Компания уходит от модели продажи отдельных «железок» к поставке интегрированных решений, где программное обеспечение, сетевая инфраструктура и сами чипы работают как единый организм. Это должно минимизировать задержки при перемещении данных между ядрами и памятью, что критически важно для задач реального времени.

Анонс Ironwood происходит на фоне острой конкуренции в сегменте проприетарных ИИ-ускорителей. Доминирование Nvidia на рынке обучения моделей неоспоримо, но в сфере инференса картина иная. Amazon уже давно использует собственные чипы Trainium и Inferentia в AWS, а Microsoft внедряет процессоры Cobalt 100 в Azure. Google, обладая уникальным опытом эксплуатации TPU в своих поисковых системах и YouTube, пытается конвертировать этот опыт в коммерческое преимущество для облачных клиентов.

С точки зрения рыночной динамики, появление Ironwood может изменить правила игры для компаний, которые уже развернули крупные ИИ-модели и теперь ищут способы снизить операционные расходы на их обслуживание. Энергоэффективность и специализация под конкретные типы данных (разреженные матрицы) делают предложение Google особенно привлекательным для секторов электронной коммерции и медиа, где рекомендательные системы являются ядром бизнеса. Однако успех Ironwood будет зависеть не только от характеристик, но и от того, насколько легко существующие клиенты Google Cloud смогут мигрировать свои инференс-нагрузки на новую архитектуру, не переписывая при этом весь код.

Опубликовано: Мировое обозрение Источник

Новая атака по России: Крым снова под ударом. Коммунаровка освобождена. Киев провоцирует Тегеран на военный ответ — Сводка с фронта 27 июля

Штилерман грозит уничтожить Wildberries и Ozon, и атаковать Москву баллистикой уже осенью

Пашинян на призыв Путина быстрее провести референдум по ЕАЭС выдвинул условие

Google представила свой самый мощный ИИ-процессор Ironwood — до 4,6 квадриллиона операций в секунду

Седьмое поколение TPU: ставка на энергоэффективность и специализацию

Архитектурные решения для облачных нагрузок

Новая архитектура облачных вычислений: AI Hypercomputer

Подписывайтесь:

Топ за неделю

Украинские БПЛА снова долетели до Башкирии. На НПЗ в Туймазах пожар

Боевые мыши НАТО: этой чудо-армией Эстония, Латвия и Литва собрались воевать с Россией

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

БПЛА атаковали гражданские автомобили на пункте пропуска «Чонгар», есть жертвы

В Белгороде в результате атаки дрона по АЗС погиб секретарь местного горкома Александр Логвинов

Боевые мыши НАТО: этой чудо-армией Эстония, Латвия и Литва собрались воевать с Россией

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

Когда падёт Запад...

Я не идеализирую Советский Союз

В Госдуме заявили, что РФ нужны системы для определения запуска ракет «Фламинго»

Google представила свой самый мощный ИИ-процессор Ironwood — до 4,6 квадриллиона операций в секунду

Седьмое поколение TPU: ставка на энергоэффективность и специализацию

Архитектурные решения для облачных нагрузок

Новая архитектура облачных вычислений: AI Hypercomputer

Подписывайтесь:

Топ за неделю

Последние новости

Согласие на использование файлов cookie