Индия представила 96-ядерный Arm-процессор собственной разработки
Индия бросает вызов глобальным монополиям: первый национальный серверный процессор Aum нацелен на рынок HPC и суверенитет данных. Разработка Центра развития передовых вычислений (C-DAC) не просто техническая новинка, а стратегический шаг Нью-Дели по снижению зависимости от западных поставщиков в эпоху обострения технологических конфликтов. Чип Aum, построенный на архитектуре Arm Neoverse V1, способен объединять до 96 ядер и должен появиться в коммерческих продуктах уже в 2024 году, производясь по 5-нанометровому техпроцессу на мощностях TSMC.
Архитектурные решения и борьба за производительность
В основе 96-ядерного решения лежат чиплеты A48Z, каждый из которых несет 48 ядер Arm Zeus с базовой частотой 3 ГГц и турбо-режимом до 3,5 ГГц. Инженерам C-DAC удалось реализовать внушительный объем кэш-памяти: 96 Мбайт L2 с прямым доступом и еще 96 Мбайт общего кэша третьего уровня. Подсистема памяти поддерживает до 64 Гбайт HBM3 с частотой 5,6 ГГц (с запасом до 6,4 ГГц), что обеспечивает пиковую пропускную способность в 2,87 Тбайт/с. Дополнительно доступны 16 каналов DDR5 с частотой до 5200 МГц.
Система межсоединений и масштабирование
Ключевая особенность Aum — 128 линий PCIe 5.0. Половина из них отведена под подключение внешних ускорителей, таких как GPU или FPGA. Оставшиеся линии формируют внутреннюю когерентную ячеистую сеть NUMA-стиля на базе протокола CCIX. Эта шина, как отмечают разработчики, заимствует отдельные решения у Infinity Fabric от AMD и позволяет объединять два процессора Aum в двухсокетную конфигурацию, обеспечивая полную когерентность памяти.
Энергопотребление как компромисс
Заявленная производительность Aum составляет 4,6 терафлопс на сокет при совокупной пропускной способности памяти в 3 Тбайт/с. Соотношение байт на флоп (0,7) значительно превосходит показатели японского суперкомпьютера Fugaku (0,38) и американского Summit (менее 0,2). Однако платой за высокую пропускную способность стало тепловыделение: TDP новинки достигает 300 Ватт, что делает ее менее энергоэффективной по сравнению с Arm-ядрами A64FX, используемыми в Fugaku.
Первый шаг к полной независимости уже сделан. Хотя процессор Aum пока базируется на лицензируемых ядрах Arm, а не на полностью оригинальной микроархитектуре, сама интеграция системы на кристалле и разработка когерентной сети являются результатом локальных исследований. Следующим этапом для C-DAC должна стать кастомизация процессорного ядра, что позволит создать по-настоящему суверенный чип и задаст стандарт для «национализации полупроводников» в других странах, стремящихся к технологическому суверенитету.
