AMD продемонстрировала ускоритель вычислений MI300X, который превосходит решение NVIDIA по объёму поддерживаемой памяти
Новый ускоритель вычислений AMD MI300X, официально анонсированный главой компании Лизой Су, способен изменить расстановку сил на рынке аппаратного обеспечения для искусственного интеллекта. Вместо того чтобы просто догонять лидера сектора NVIDIA, AMD делает ставку на архитектурные решения, которые напрямую решают главную «головную боль» разработчиков больших языковых моделей (LLM) — нехватку памяти.
Превосходство в объеме памяти как главный козырь
Ключевое отличие MI300X от конкурента H100 — это поддержка 192 Гбайт памяти HBM3 против 120 Гбайт у NVIDIA. Как пояснила Лиза Су, современные языковые модели растут экспоненциально, и именно пропускная способность и объем видеопамяти становятся узким местом. За счет большего буфера AMD позволяет запускать модели с 40 млрд параметров на меньшем количестве физических ускорителей, что напрямую снижает стоимость владения инфраструктурой для дата-центров.
Архитектурные решения: Zen 4, CDNA 3 и 153 млрд транзисторов
Архитектурно MI300X представляет собой гибридную монолитную конструкцию. На одной подложке объединены вычислительные ядра Zen 4 (традиционные CPU-ядра) и графические блоки CDNA 3, что обеспечивает гибкость при обработке как инференса, так и обучения нейросетей. Общее количество транзисторов достигает 153 млрд — это один из самых сложных чипов в истории полупроводниковой индустрии.
- Пропускная способность памяти: 5,2 Тбайт/с.
- Межсоединение: Интерфейс Infinity Fabric обеспечивает скорость передачи данных до 896 Гбайт/с.
- Масштабируемость: Система поддерживает объединение до восьми ускорителей MI300X в одном узле.
Битва экосистем: CUDA против открытой платформы ROCm
NVIDIA долгие годы удерживает лидерство не столько за счет «железа», сколько за счет зрелой программной платформы CUDA. AMD противопоставляет ей открытую экосистему ROCm, которая позиционируется как более гибкая и независимая альтернатива. В ходе демонстрации ускоритель успешно работал с языковой моделью на 40 млрд параметров, что подтверждает совместимость с современными фреймворками. Однако, чтобы переманить клиентов у NVIDIA, AMD предстоит доказать, что ROCm не уступает CUDA в стабильности и производительности при работе с реальными бизнес-задачами.
Первые поставки MI300X клиентам начнутся до конца текущего года. Это означает, что уже в ближайшие месяцы мы увидим первые независимые бенчмарки, которые покажут, насколько эффективно новое решение AMD справляется с нагрузками GPT-подобных моделей.
Ранее рынок ускорителей для ИИ фактически был монополизирован NVIDIA: компания контролировала более 80% сегмента из-за дефицита чипов H100 и привязки к CUDA. Появление конкурента с сопоставимой сырой производительностью и большим объемом памяти создает прецедент для снижения цен. Кроме того, ставка AMD на открытые стандарты может ускорить миграцию разработчиков с проприетарных решений, что в долгосрочной перспективе ослабит зависимость отрасли от одного вендора. Для дата-центров это означает возможность выбора и потенциальную экономию бюджета при масштабировании вычислительных мощностей.












