Китайская Loongson анонсировала ИИ-ускоритель LG200 на фирменном GPU

01 дек 2023, 20:16

906

Китайский производитель полупроводников Loongson представил специализированный ускоритель LG200, который, по замыслу инженеров, должен заместить в локальной инфраструктуре решения NVIDIA H100 и A100. Однако первые характеристики устройства указывают скорее на нишевый продукт для задач с низким энергопотреблением, чем на прямого конкурента лидерам рынка. На фоне ужесточения экспортных ограничений со стороны США, китайские компании вынуждены форсировать разработку собственных GPU, и LG200 — один из таких шагов, пусть и с оговорками по производительности.

Архитектура LG200: ставка на масштабирование малых блоков

Согласно опубликованной блок-схеме, графический процессор LG200 построен по модульному принципу. В его основе лежат четыре кластера, каждый из которых включает 16 малых арифметико-логических устройств (ALU), четыре крупных блока ALU и один массивный вычислительный модуль. Такая конфигурация намекает на попытку добиться параллелизма за счет объединения большого количества относительно простых вычислительных ядер. Официальных данных о тактовой частоте, техпроцессе и объеме кэш-памяти производитель пока не приводит, что затрудняет объективную оценку реальной производительности.

Программная совместимость и поддерживаемые форматы данных

Разработчик заявляет о поддержке интерфейсов OpenCL 3.0 для вычислительных задач и OpenGL 4.0 для графических нагрузок. Это позволяет говорить о базовой совместимости с существующим программным стеком, хотя полная интеграция в экосистемы машинного обучения (например, CUDA или ROCm) остаётся под вопросом. Для работы с искусственным интеллектом LG200 поддерживает целочисленный формат INT8, а также операции с плавающей запятой одинарной (FP32) и двойной (FP64) точности.

Производительность: от 256 Гфлопс до 1 Тфлопс на узел

Заявленная вычислительная мощность варьируется от 256 гигафлопс до 1 терафлопс на узел. Ключевая неопределенность заключается в том, для какой точности вычислений приводятся эти цифры. Если речь идет о FP64, то показатель LG200 более чем в 60 раз уступает ускорителю NVIDIA H100 (67 Тфлопс). Даже при оптимистичном сценарии с FP32, результат оказывается значительно скромнее современных аналогов. Это позволяет предположить, что LG200 изначально проектировался для маломощных логических вычислений, встраиваемых систем или специализированных контроллеров, а не для обучения тяжелых нейросетей.

Позиционирование на рынке: GPGPU для вычислительных задач общего назначения

Loongson относит LG200 к категории GPGPU — графических процессоров общего назначения. Формально это означает, что ускоритель пригоден не только для ИИ и HPC, но и для широкого круга вычислительных сценариев, не связанных с рендерингом. Однако без раскрытия деталей о пропускной способности памяти и шине обмена данными сложно оценить его реальную применимость в серверных стойках или дата-центрах.

Ранее Loongson выпустила процессор 3A6000, показавший уровень IPC, сопоставимый с Intel Core i5-14600K в определенных тестах. Компания последовательно наращивает компетенции в области CPU и GPU, пытаясь создать замкнутую аппаратную экосистему, независимую от западных поставщиков. В условиях, когда американские санкции блокируют поставки мощных ИИ-ускорителей в Китай, локальные вендоры, включая Loongson, Huawei и Cambricon, активизировали разработку альтернатив.

Появление LG200 вряд ли изменит расстановку сил на глобальном рынке высокопроизводительных вычислений. Скорее, это сигнал о том, что китайская полупроводниковая отрасль переходит от стратегии копирования к созданию собственных архитектур, пусть и с отставанием в производительности. Основным драйвером спроса на такие ускорители станет внутренний рынок, где государственные и корпоративные заказчики вынуждены выбирать между западными решениями с ограниченным доступом и отечественными продуктами с более скромными характеристиками, но гарантированной поставкой.

Опубликовано: Мировое обозрение Источник