NVIDIA и Amazon анонсировали мощнейший облачный ИИ-суперкомпьютер Project Ceiba
NVIDIA и Amazon Web Services (AWS) представили совместный проект, который может кардинально изменить рынок облачных вычислений для искусственного интеллекта. Речь идет не просто об очередном партнерстве, а о создании инфраструктуры, способной обучать нейросети с триллионом параметров — то, что еще недавно считалось уделом эксклюзивных государственных лабораторий. Ключевой вопрос теперь не в том, возможны ли такие вычисления, а в том, кто первым получит к ним доступ и по какой цене.
Облачный суперкомпьютер как новая реальность
Центральным элементом анонса стала система NVIDIA GH200 NVL32. Это не отдельный сервер, а готовая вычислительная стойка, объединяющая 32 гибридных ускорителя GH200 Grace Hopper Superchip. Каждый такой ускоритель — это двухчиповый модуль, сочетающий 72-ядерный центральный процессор на архитектуре Arm Neoverse и графический процессор NVIDIA H100. В конфигурации NVL32 система выдает до 128 Пфлопс в операциях FP8, что делает ее одной из самых плотных по производительности среди коммерчески доступных решений.
Архитектура и инженерные решения
Инженеры NVIDIA применили ряд нестандартных подходов. Система располагает 2304 процессорными ядрами и 20 Тбайт оперативной памяти, из которых 4,5 Тбайт приходится на высокоскоростную память HBM3e с пропускной способностью 157 Тбайт/с. Взаимодействие между суперчипами обеспечивается через девять коммутаторов NVSwitch и интерфейс NVLink, суммарная пропускная способность которого достигает 57,6 Тбайт/с. Для отвода тепла от таких мощностей используется жидкостное охлаждение — воздушные системы здесь уже неэффективны.
AWS первой среди облачных провайдеров предложит GH200 NVL32 в составе платформы NVIDIA DGX Cloud. Более того, Amazon предоставит возможность объединять такие стойки в кластеры EC2 UltraClusters, что даст клиентам доступ к тысячам ускорителей GH200. По заявлению NVIDIA, подобная конфигурация идеально подходит как для обучения, так и для инференса крупных нейросетей, включая модели с 1 трлн параметров.
Project Ceiba: новый рекорд производительности
Отдельного внимания заслуживает анонс Project Ceiba — суперкомпьютера, который претендует на звание самого быстрого в мире для задач ИИ на базе GPU. Система обеспечит пиковую производительность в 65 Эксафлопс (в операции FP8). Для сравнения: это в десятки раз превышает мощность многих современных суперкомпьютеров общего назначения. Ceiba объединит 16 384 ускорителя GH200, 9,1 Пбайт памяти и получит интерконнект с пропускной способностью 410 Тбайт/с. Машина будет развернута в инфраструктуре AWS DGX Cloud и станет доступна клиентам в следующем году.
Совместные проекты NVIDIA и AWS не возникают на пустом месте. До этого анонса рынок уже видел внедрение ускорителей H100 в облачные сервисы, но предложение GH200 NVL32 и Project Ceiba — это качественный скачок. Ранее подобные вычислительные мощности были доступны лишь в рамках закрытых правительственных программ или исследовательских консорциумов. Теперь же облачные гиганты начинают конкурировать за право предоставлять «тяжелые» ИИ-мощности как услугу.
Появление таких систем означает, что барьер входа для разработки больших языковых моделей (LLM) и генеративных нейросетей будет снижаться. Компании, которые раньше не могли позволить себе собственные вычислительные кластеры, получат доступ к производительности, сопоставимой с лучшими мировыми лабораториями. Однако это же создает и новые риски: концентрация подобных вычислительных ресурсов у нескольких провайдеров может привести к монополизации рынка ИИ-услуг и росту стоимости облачных вычислений для стартапов. В ближайшие два года именно доступ к таким суперкомпьютерам, а не только алгоритмы, станет главным фактором, определяющим лидерство в гонке искусственного интеллекта.















