Intel показала на Computex ускорители Ponte Vecchio живьём
На выставке Computex 2023 компания Supermicro представила серверную станцию X13 8U, наглядно продемонстрировав, как будет выглядеть инфраструктура для обучения больших языковых моделей и высокопроизводительных вычислений (HPC) в ближайшие годы. Восемь ускорителей Intel Data Center GPU Max 1550 (Ponte Vecchio), работающие в паре с двумя процессорами Xeon Scalable четвертого поколения Sapphire Rapids, образуют вычислительный монолит, потребляющий мощность, сопоставимую с энергией для обогрева небольшого дома. Однако ключевой вопрос заключается не в том, как собрать такую систему, а в том, какие инженерные компромиссы пришлось найти для её охлаждения и питания.
Архитектура Ponte Vecchio: гетерогенная сложность на грани физики
Каждый ускоритель Ponte Vecchio содержит более 100 миллиардов транзисторов, распределенных по 47 чиплетам (или «плиткам»). Внутри одного модуля сосуществуют вычислительные ядра, чиплеты кэша Rambo, контроллеры интерфейса Xe Link и стеки памяти HBM2E. Площадь подложки GPU составляет 2330 мм² — это один из крупнейших кристаллов в индустрии. Соединение всех этих гетерогенных компонентов стало возможным благодаря фирменным технологиям 3D-упаковки Intel: Embedded Multi-Die Interconnect Bridge (EMIB) и Foveros. Разные типы чиплетов производятся по различным техпроцессам, что добавляет логистической и технологической сложности, но позволяет оптимизировать стоимость и производительность каждого блока.
Энергопотребление и система охлаждения: инженерный вызов
Тепловой пакет (TDP) одного ускорителя Ponte Vecchio составляет 600 Вт. В восьмимодульной конфигурации сервера Supermicro X13 8U совокупное тепловыделение достигает 4,8 кВт только от GPU, не считая процессоров Xeon с их TDP до 350 Вт каждый. Для сравнения, флагманский ускоритель конкурента AMD Instinct MI250X имеет TDP 550 Вт и оснащается одним преобразователем напряжения. В Ponte Vecchio таких преобразователей два — это необходимое решение для стабильной подачи тока при пиковых нагрузках. Разъем OAM-модуля рассчитан на передачу до 700 Вт, что оставляет небольшой запас для кратковременных скачков энергопотребления.
Отвод такого количества тепла потребовал нетривиальных решений. Радиаторы охлаждения представляют собой массивные конструкции с медными теплопроводящими трубками и десятками алюминиевых ребер. Вентиляторы высокого статического давления прогоняют через эту систему огромные объемы воздуха. Без эффективного охлаждения даже кратковременная работа системы под нагрузкой привела бы к троттлингу или аварийному отключению.
Серверная платформа Supermicro X13 8U: инфраструктура для ИИ
Помимо восьми ускорителей Ponte Vecchio, станция поддерживает установку до 32 модулей оперативной памяти и до 20 быстрозаменяемых 2,5-дюймовых накопителей. Из них 12 работают по протоколу NVMe, а 8 — по SATA. Такая конфигурация позволяет обеспечить высокоскоростной обмен данными между вычислительными узлами и системой хранения, что критически важно для задач машинного обучения, где bottleneck (узким местом) часто является скорость чтения датасетов.
Демонстрация подобных систем на выставках — это не просто показ технологий. Это сигнал рынку о готовности инфраструктуры к эпохе ИИ, где вычислительная мощность измеряется не терафлопсами, а десятками петафлопс в одной стойке. Однако за этой мощностью стоит серьезный вопрос энергоэффективности и тепловыделения, который дата-центрам придется решать на уровне архитектуры зданий и систем кондиционирования.















