NVIDIA выпустит трио ИИ-ускорителей для Китая с заниженной производительностью
Компания NVIDIA выпустит три новых специализированных ИИ-ускорителя для Китая. Новинки станут ответом на очередные торговые ограничения США, касающиеся экспорта вычислительного оборудования для центров обработки данных в Китай и другие страны. Об этом сообщают сразу несколько источников.

Источник изображений: NVIDIA
Новые экспортные правила, введённые США, учитывают общую производительность специализированных ускорителей и опускают её планку настолько, что под запрет поставок в Китай, Россию и ряд других стран попадает даже игровая видеокарта GeForce RTX 4090. В соответствии с новыми ограничениями, произведение количества битов на вычислительную производительность, именуемое Total Processing Performance или TPP, не должно превышать величину 4800, а у игрового флагмана NVIDIA оно составляет 5285.
По данным аналитиков
Точные характеристики ускорителей NVIDIA H20, L20 и L2 неизвестны. По данным одних источников, H20 построен на модифицированном графическом чипе GH100 на архитектуре Hopper и использует упаковку CoWoS от TSMC. Два представителя L-серии могут иметь отношение к архитектуре Ada Lovelace. Bloomberg же сообщает, что все новинки используют архитектуру Hopper. Аналитики Semianalysis отмечают, что H20 с некоторыми задачами может справляться даже лучше, чем ускоритель H100, попавший под запрет поставок.
Китайский ресурс ITHome опубликовал основные характеристики названных ускорителей. Согласно этим данным, H20 получит 96 Гбайт памяти HBM3 с пропускной способностью 4 Тбайт/с и предложит производительность тензорных ядер до 296 Тфлопс в целочисленных операциях INT8. Показатель TPP у новинки составит 2368 и с запасом уложится в новые экспортные ограничения. В операциях FP64 ускоритель H20 обеспечит производительность на уровне 1 Тфлопс (H100 выдаёт 34 Тфлоп), а в операциях FP16/BF16 — 148 Тфлопс (H100 обеспечивает 1979 Тфлопс). Энергопотребление H20 составит 400 Вт. H20 сохранит поддержку шины NVLink со скоростью 900 Гбайт/с. Благодаря этому можно будет объединять в кластеры до восьми ускорителей.
Модель NVIDIA L20 в формфакторе PCIe получит 48 Гбайт памяти GDDR6 и обеспечит пиковую вычислительную производительность в 239 Тфлопс в операциях INT8. В свою очередь, модель L2, тоже в формфакторе PCIe, получит 24 Гбайт памяти GDDR6 и будет обладать пиковой вычислительной производительностью 193 Тфлопс в задачах INT8. Показатели TPP у моделей L20 и L2 составят 1912 и 1544 соответственно.
Издание Bloomberg сообщает, что в NVIDIA отказались от комментариев по поводу последних утечек, однако на фоне указанных сообщений акции компании до начала торгов на Нью-Йоркской фондовой бирже выросли на 1,9 %.