NVIDIA выпустит трио ИИ-ускорителей для Китая с заниженной производительностью
Уже в ближайшие дни китайский рынок может получить новую партию ИИ-ускорителей от NVIDIA, разработанных в обход последних экспортных ограничений США. Речь идет о моделях H20, L20 и L2, которые, по данным отраслевых источников, начнут поставляться в КНР до конца ноября. Этот шаг — не просто выпуск новой продукции, а вынужденная и тщательно просчитанная адаптация стратегии полупроводникового гиганта к новым геополитическим реалиям, где на кону стоит многомиллиардный китайский рынок искусственного интеллекта.
Три новых специализированных чипа для обхода ограничений
Основной причиной появления линейки H20, L20 и L2 стали ужесточенные требования американского правительства к экспорту вычислительной техники. Новый критерий, известный как Total Processing Performance (TPP), учитывает произведение разрядности вычислений на производительность. Его пороговое значение в 4800 единиц делает невозможной поставку в Китай не только серверных решений, но даже игрового флагмана GeForce RTX 4090, чей показатель TPP составляет 5285.
Архитектурные ухищрения: Hopper против Ada Lovelace
Согласно утечкам, флагман новой серии H20 построен на модифицированном графическом чипе GH100 архитектуры Hopper с использованием передовой упаковки CoWoS от TSMC. Его показатели TPP намеренно занижены до 2368, что с запасом укладывается в рамки закона. При этом аналитики отмечают парадоксальную ситуацию: в некоторых задачах, связанных с разреженными вычислениями, H20 может превосходить полноценный H100, который находится под полным запретом на экспорт. Две другие модели, L20 и L2, по некоторым данным, базируются на архитектуре Ada Lovelace, хотя источники Bloomberg настаивают на единой платформе Hopper для всех новинок.
Технические характеристики: производительность в ущерб сырой мощи
Наиболее полные спецификации опубликовал китайский портал ITHome. Ускоритель H20 оснащается 96 Гбайт памяти HBM3 с пропускной способностью 4 Тбайт/с. Однако его производительность в операциях двойной точности (FP64) искусственно ограничена до 1 Тфлопс против 34 Тфлопс у H100. В ключевом для ИИ-инференса режиме INT8 он выдает до 296 Тфлопс. Энергопотребление составляет 400 Вт, при этом сохранена поддержка высокоскоростной шины NVLink (900 Гбайт/с), что позволяет объединять до восьми таких ускорителей в кластер.
Младшие модели L20 и L2 выполнены в форм-факторе PCIe. L20 получит 48 Гбайт памяти GDDR6 с пиковой производительностью 239 Тфлопс (INT8) и TPP 1912. L2 оснащается 24 Гбайт GDDR6, обеспечивая 193 Тфлопс при TPP 1544. Таким образом, все три решения демонстрируют, что NVIDIA готова жертвовать пиковой производительностью ради сохранения присутствия на стратегически важном рынке.
Массовое производство H20 и L20, по разным данным, начнется уже в декабре, а L2 — в январе. Официальные комментарии от NVIDIA пока отсутствуют, однако реакция рынка была незамедлительной: акции компании выросли на 1,9% на фоне новостей об утечках.
Ранее NVIDIA уже пыталась адаптировать свои продукты для Китая, выпустив урезанную версию A800, но и она попала под новые ограничения. Нынешняя ситуация демонстрирует, что гонка вооружений в сфере полупроводников переходит в новую фазу, где компании вынуждены разрабатывать не просто лучшие, а «легальные» чипы. Для китайских дата-центров появление H20, L20 и L2 означает временное решение проблемы дефицита вычислительных мощностей, однако существенное отставание в производительности по сравнению с топовыми решениями (особенно в FP64 и FP16) может замедлить развитие ресурсоемких исследовательских проектов. Для самой NVIDIA это компромиссный шаг, позволяющий сохранить долю рынка, но создающий прецедент, когда продуктовая линейка диктуется не инженерной мыслью, а политическими решениями.















