IBM разработала энергоэффективный аналоговый процессор для ИИ
Новый процессор IBM, работающий на принципах аналоговых вычислений, способен выполнять 12,4 триллиона операций на ватт потребляемой мощности. Эта цифра может кардинально изменить экономику дата-центров и снизить углеродный след от работы больших языковых моделей, таких как ChatGPT, которые сегодня требуют огромных энергетических затрат.
Аналоговый прорыв: как фазово-изменяемая память меняет правила игры
Современные нейросети, содержащие миллиарды параметров, сталкиваются с фундаментальным ограничением — «бутылочным горлышком» памяти. Каждое обращение к данным требует энергии, и при масштабах современных моделей это приводит к колоссальным счетам за электричество. Инженеры IBM предложили элегантное решение: выполнять вычисления непосредственно в памяти, используя её физические свойства.
Принцип работы: от цифровых нулей к плавной регулировке
В основе разработки лежит фазово-изменяемая память (PCM). В отличие от традиционных транзисторов, которые работают в бинарном режиме «включено/выключено», PCM-ячейки способны принимать любое промежуточное состояние. Это позволяет хранить не просто единицу или ноль, а целый спектр значений, что идеально соответствует природе синаптических весов в нейронных сетях.
Каждый узел в такой сети получает входной сигнал и, подобно регулятору громкости, определяет, какую часть сигнала передать дальше. Эта «сила связи» кодируется не отдельной цифровой операцией, а физическим состоянием ячейки памяти, что радикально снижает энергопотребление.
Архитектура чипа: плиточная структура для масштабирования
Новый процессор построен по модульному принципу. Ключевым элементом является «плитка» — массив из 512 на 2048 ячеек PCM, организованных в виде крестообразной сетки. Один чип объединяет 34 такие плитки, что в сумме составляет около 35 миллионов бит фазово-изменяемой памяти. Такая архитектура позволяет гибко настраивать силу соединений, используя переменное число битов для каждого синапса.
Система поддерживает коммуникацию между несколькими чипами, что открывает путь к распределению крупных задач между вычислительными модулями. В тестовом сценарии распознавания речи процессор продемонстрировал пиковую эффективность в 12,4 трлн операций на ватт — показатель, недостижимый для традиционных архитектур.
Ограничения и перспективы: Разработка IBM оптимизирована для инференса (выполнения уже обученных моделей), а не для их обучения. Процесс тренировки нейросети требует адаптации под специфику аналоговых вычислений. Кроме того, чип эффективен только для определённых типов нейронных сетей, что пока ограничивает его универсальность.
Попытки совместить память и вычисления предпринимались и ранее. Intel и сама IBM разрабатывали чипы, где каждый нейрон получает выделенную память. Однако представленное решение ближе всех подошло к созданию полноценного функционального процессора для ИИ, способного работать с масштабами, сопоставимыми с большими языковыми моделями.
Снижение энергопотребления на порядки меняет экономику развёртывания ИИ-сервисов. Для операторов дата-центров это означает не только сокращение счетов за электричество, но и возможность размещать вычислительные мощности в регионах с нестабильным энергоснабжением. Для экологии — уменьшение углеродного следа от индустрии, которая потребляет всё больше ресурсов. Пока чип не может заменить универсальные GPU для обучения, но как специализированное решение для выполнения задач он может стать стандартом для энергоэффективного ИИ.















