Google Cloud представила пятое поколение тензорных процессоров для обучения ИИ

30 авг 2023, 18:49

646

Google Cloud представила пятое поколение тензорных процессоров (TPU v5e), которое, по заявлению компании, кардинально меняет экономику машинного обучения. Вместо гонки за абсолютной производительностью, инженеры сосредоточились на эффективности: новый чип обещает двукратное улучшение производительности на доллар при обучении больших языковых моделей (LLM) и генеративных нейросетей, а для инференс-систем этот показатель достигает 2,5-кратного роста.

Экономический прорыв: как TPU v5e снижает порог входа в ИИ

Ключевое заявление вице-президента Google Cloud Марка Ломейера сводится к тому, что TPU v5e становится «самым экономичным и доступным облачным TPU на сегодняшний день». Это не просто маркетинговый ход, а сдвиг парадигмы: теперь разработчики могут масштабировать свои модели без экспоненциального роста затрат. При этом технические характеристики не принесены в жертву цене.

Архитектура масштабирования: от одного чипа до десятков тысяч

Кластеры TPU v5e способны объединять до 256 чипов через высокоскоростной интерконнект с совокупной пропускной способностью свыше 400 Тбит/с. Это позволяет достичь производительности в 100 Петаопс (Попс) в INT8-вычислениях. Однако главное новшество — возможность распределять одну рабочую нагрузку ИИ на несколько физических кластеров, масштабируясь буквально до десятков тысяч чипов. Как подчеркнул Ломейер, такая архитектура устраняет физические ограничения одного модуля, предоставляя клиентам гибкость для работы с самыми ресурсоемкими задачами. В дополнение к анонсу TPU, Google объявила о скором запуске общедоступных виртуальных кластеров A3, оснащенных графическими процессорами Nvidia H100. Это создает альтернативу для тех разработчиков, чьи задачи лучше решаются на GPU-архитектуре. Предыдущее, четвертое поколение TPU было анонсировано в 2021 году, но стало доступно разработчикам лишь в 2022-м. Сейчас Google сокращает разрыв между анонсом и коммерческой доступностью, что говорит о зрелости технологии и стремлении закрепиться на быстрорастущем рынке облачных ИИ-услуг. Выбор между TPU v5e и кластерами на Nvidia H100 сигнализирует о новой тенденции: поставщики облачных услуг больше не пытаются унифицировать инфраструктуру. Вместо этого они предлагают специализированные решения, позволяя клиентам выбирать архитектуру под конкретную задачу — будь то обучение гигантских моделей или высоконагруженный инференс. Это усилит конкуренцию в сегменте облачного ИИ, где главным полем битвы становится не сырая мощность, а стоимость единицы вычислений.

Опубликовано: Мировое обозрение Источник