NVIDIA и Amazon анонсировали мощнейший облачный ИИ-суперкомпьютер Project Ceiba

Военные конфликты

Иран сыграл на руку Киеву? Почему Трамп может поддержать Зеленского вопреки ожиданиям

Облачный суперкомпьютер как новая реальность

Центральным элементом анонса стала система NVIDIA GH200 NVL32. Это не отдельный сервер, а готовая вычислительная стойка, объединяющая 32 гибридных ускорителя GH200 Grace Hopper Superchip. Каждый такой ускоритель — это двухчиповый модуль, сочетающий 72-ядерный центральный процессор на архитектуре Arm Neoverse и графический процессор NVIDIA H100. В конфигурации NVL32 система выдает до 128 Пфлопс в операциях FP8, что делает ее одной из самых плотных по производительности среди коммерчески доступных решений.

Архитектура и инженерные решения

Инженеры NVIDIA применили ряд нестандартных подходов. Система располагает 2304 процессорными ядрами и 20 Тбайт оперативной памяти, из которых 4,5 Тбайт приходится на высокоскоростную память HBM3e с пропускной способностью 157 Тбайт/с. Взаимодействие между суперчипами обеспечивается через девять коммутаторов NVSwitch и интерфейс NVLink, суммарная пропускная способность которого достигает 57,6 Тбайт/с. Для отвода тепла от таких мощностей используется жидкостное охлаждение — воздушные системы здесь уже неэффективны.

AWS первой среди облачных провайдеров предложит GH200 NVL32 в составе платформы NVIDIA DGX Cloud. Более того, Amazon предоставит возможность объединять такие стойки в кластеры EC2 UltraClusters, что даст клиентам доступ к тысячам ускорителей GH200. По заявлению NVIDIA, подобная конфигурация идеально подходит как для обучения, так и для инференса крупных нейросетей, включая модели с 1 трлн параметров.

Project Ceiba: новый рекорд производительности

Отдельного внимания заслуживает анонс Project Ceiba — суперкомпьютера, который претендует на звание самого быстрого в мире для задач ИИ на базе GPU. Система обеспечит пиковую производительность в 65 Эксафлопс (в операции FP8). Для сравнения: это в десятки раз превышает мощность многих современных суперкомпьютеров общего назначения. Ceiba объединит 16 384 ускорителя GH200, 9,1 Пбайт памяти и получит интерконнект с пропускной способностью 410 Тбайт/с. Машина будет развернута в инфраструктуре AWS DGX Cloud и станет доступна клиентам в следующем году.

Совместные проекты NVIDIA и AWS не возникают на пустом месте. До этого анонса рынок уже видел внедрение ускорителей H100 в облачные сервисы, но предложение GH200 NVL32 и Project Ceiba — это качественный скачок. Ранее подобные вычислительные мощности были доступны лишь в рамках закрытых правительственных программ или исследовательских консорциумов. Теперь же облачные гиганты начинают конкурировать за право предоставлять «тяжелые» ИИ-мощности как услугу.

Появление таких систем означает, что барьер входа для разработки больших языковых моделей (LLM) и генеративных нейросетей будет снижаться. Компании, которые раньше не могли позволить себе собственные вычислительные кластеры, получат доступ к производительности, сопоставимой с лучшими мировыми лабораториями. Однако это же создает и новые риски: концентрация подобных вычислительных ресурсов у нескольких провайдеров может привести к монополизации рынка ИИ-услуг и росту стоимости облачных вычислений для стартапов. В ближайшие два года именно доступ к таким суперкомпьютерам, а не только алгоритмы, станет главным фактором, определяющим лидерство в гонке искусственного интеллекта.