NVIDIA представила суперчип GH200 Grace Hopper с памятью HBM3e и производительностью 4 Пфлопс
Анонс новой платформы NVIDIA на SIGGRAPH 2023 стал не просто очередным обновлением технических спецификаций, а сигналом о кардинальном изменении правил игры в сфере генеративного искусственного интеллекта. В условиях, когда вычислительные мощности дата-центров перестают справляться с запросами больших языковых моделей, компания представила решение, которое втрое увеличивает пропускную способность памяти и позволяет запускать модели в 3,5 раза большего размера. Речь идет о платформе GH200 Grace Hopper SuperChip нового поколения, которая, по сути, превращает один сервер в мини-суперкомпьютер производительностью до 8 петафлопс.
Архитектура прорыва: память HBM3e и двучиповая компоновка
В основе анонса лежит не просто улучшенный суперчип, а новая философия построения вычислительных систем. Платформа базируется на двухчиповом тандеме: центральный процессор NVIDIA Grace и графический процессор объединены в единую экосистему. Ключевое нововведение — использование набортной памяти стандарта HBM3e. Этот тип памяти на 50% быстрее предыдущего поколения HBM3, что позволяет достигать совокупной пропускной способности в 10 Тбайт/с в многоплатформенных конфигурациях.
Сервер на базе двух таких суперчипов получает 144 ядра Arm Neoverse, работающих в связке с 282 Гбайт высокоскоростной памяти. Для сравнения: это в 3,5 раза больше памяти и втрое выше пропускная способность, чем у предшествующей версии. Такая архитектура решает главное узкое место современных ИИ-вычислений — скорость обмена данными между процессором и памятью.
Технология NVLink: объединение ресурсов без потерь
Инженеры NVIDIA реализовали возможность объединения нескольких суперчипов Grace Hopper через высокоскоростную шину NVLink. Эта технология предоставляет графическому процессору полный доступ к памяти центрального процессора. В конфигурации с двумя суперчипами суммарный объем быстрой памяти достигает 1,2 Тбайт. Такой подход позволяет развертывать крупномасштабные вычислительные системы, способные решать комплексные задачи генеративного ИИ без необходимости фрагментировать модель между слабо связанными узлами.
Совместимость и готовность рынка
Важным аспектом стратегии NVIDIA является унификация. Новая платформа полностью совместима со спецификациями серверной модульной архитектуры MGX, представленной на выставке Computex 2023. Это означает, что любой производитель серверных решений может интегрировать Grace Hopper в более чем 100 вариантов корпусов и шасси, представленных на рынке. Такой подход снижает порог входа для производителей и ускоряет внедрение технологии в промышленных масштабах.
Ведущие вендоры уже начали проектировать системы на базе нового суперчипа. Ожидается, что коммерческие поставки серверов с платформой GH200 Grace Hopper SuperChip начнутся во втором квартале 2024 года.
Ранее NVIDIA уже тестировала концепцию гибридных чипов для ИИ, но именно переход на HBM3e и двучиповая компоновка стали ответом на критику недостаточной пропускной способности памяти в предыдущих поколениях. Предшествующая платформа Grace Hopper, анонсированная в 2022 году, была ориентирована на научные вычисления, тогда как новая версия явно заточена под коммерческие задачи генеративного ИИ.
Этот анонс сдвигает фокус конкуренции с производительности самих GPU на скорость обмена данными и масштабируемость систем. Пока конкуренты борются за наращивание тактовых частот, NVIDIA предлагает рынку готовую экосистему, где узким местом перестает быть память. Для операторов дата-центров это означает возможность обслуживать в три раза больше запросов к ИИ-моделям без пропорционального увеличения площади стойки и энергопотребления. В условиях дефицита электроэнергии и охлаждения для ЦОДов это становится критическим конкурентным преимуществом.


