NVIDIA выпустит трио ИИ-ускорителей для Китая с заниженной производительностью

09 ноя 2023, 20:22

737

Компания NVIDIA выпустит три новых специализированных ИИ-ускорителя для Китая. Новинки станут ответом на очередные торговые ограничения США, касающиеся экспорта вычислительного оборудования для центров обработки данных в Китай и другие страны. Об этом сообщают сразу несколько источников.

Источник изображений: NVIDIA

Новые экспортные правила, введённые США, учитывают общую производительность специализированных ускорителей и опускают её планку настолько, что под запрет поставок в Китай, Россию и ряд других стран попадает даже игровая видеокарта GeForce RTX 4090. В соответствии с новыми ограничениями, произведение количества битов на вычислительную производительность, именуемое Total Processing Performance или TPP, не должно превышать величину 4800, а у игрового флагмана NVIDIA оно составляет 5285.

Источник изображения: Semianalysis

По данным аналитиков Semianalysis, у NVIDIA уже имеются новые модели ИИ-ускорителей, которые не подпадают под последние экспортные ограничения. Они получили названия H20, L20 и L2. По информации Semianalysis, их массовое производство начнётся в следующем месяце. В свою очередь, китайское государственное новостное издание Chinastarmarket, на которое ссылается Bloomberg, сообщает, что NVIDIA начнёт поставки этих ускорителей в Китай уже на днях, а их официальный анонс состоится во второй половине текущего месяца. По данным китайского портала ITHome, массовое производство H20, L20 начнётся в декабре, а ускорителя L2 — в январе.

Точные характеристики ускорителей NVIDIA H20, L20 и L2 неизвестны. По данным одних источников, H20 построен на модифицированном графическом чипе GH100 на архитектуре Hopper и использует упаковку CoWoS от TSMC. Два представителя L-серии могут иметь отношение к архитектуре Ada Lovelace. Bloomberg же сообщает, что все новинки используют архитектуру Hopper. Аналитики Semianalysis отмечают, что H20 с некоторыми задачами может справляться даже лучше, чем ускоритель H100, попавший под запрет поставок.

Источник изображения: ITHome

Китайский ресурс ITHome опубликовал основные характеристики названных ускорителей. Согласно этим данным, H20 получит 96 Гбайт памяти HBM3 с пропускной способностью 4 Тбайт/с и предложит производительность тензорных ядер до 296 Тфлопс в целочисленных операциях INT8. Показатель TPP у новинки составит 2368 и с запасом уложится в новые экспортные ограничения. В операциях FP64 ускоритель H20 обеспечит производительность на уровне 1 Тфлопс (H100 выдаёт 34 Тфлоп), а в операциях FP16/BF16 — 148 Тфлопс (H100 обеспечивает 1979 Тфлопс). Энергопотребление H20 составит 400 Вт. H20 сохранит поддержку шины NVLink со скоростью 900 Гбайт/с. Благодаря этому можно будет объединять в кластеры до восьми ускорителей.

Модель NVIDIA L20 в формфакторе PCIe получит 48 Гбайт памяти GDDR6 и обеспечит пиковую вычислительную производительность в 239 Тфлопс в операциях INT8. В свою очередь, модель L2, тоже в формфакторе PCIe, получит 24 Гбайт памяти GDDR6 и будет обладать пиковой вычислительной производительностью 193 Тфлопс в задачах INT8. Показатели TPP у моделей L20 и L2 составят 1912 и 1544 соответственно.

Издание Bloomberg сообщает, что в NVIDIA отказались от комментариев по поводу последних утечек, однако на фоне указанных сообщений акции компании до начала торгов на Нью-Йоркской фондовой бирже выросли на 1,9 %.

Опубликовано: Мировое обозрение Источник