Tesla запустила суперкомпьютер на 10 тыс. ускорителей NVIDIA H100 — на нём будут учить автопилот
Инвестиция в $300 миллионов: Tesla бросила вызов рынку суперкомпьютеров, запустив кластер, который не только превзошел по пиковой производительности четвертую машину мирового рейтинга, но и стал ключевым инструментом в гонке за полноценным автопилотом. В то время как отрасль задыхается от дефицита чипов, Илон Маск делает ставку на гибридную стратегию: использует дефицитные ускорители NVIDIA прямо сейчас и параллельно вкладывает миллиард долларов в собственный проект Dojo.
Рекордные показатели и скрытые ограничения
Новый кластер построен на базе 10 тысяч графических ускорителей NVIDIA H100. Заявленная пиковая производительность составляет 340 Пфлопс в операциях FP64 (двойная точность), что действительно ставит его выше суперкомпьютера Leonardo с его 304 Пфлопс. Однако эксперты отмечают, что реальная производительность в бенчмарках HPL (High-Performance Linpack), которые используются для составления рейтинга Top500, может отличаться от теоретической. Для задач искусственного интеллекта система выдает 39,58 Эфлопс в операциях INT8.
Почему это не просто еще один сервер
Ключевое отличие подхода Tesla — не столько в абсолютной мощности, сколько в специализации. Это не универсальный вычислитель для научных расчетов, а инженерный инструмент, заточенный под обучение нейросетей. Система предназначена для обработки петабайтов видеоданных, которые ежедневно генерируют миллионы автомобилей компании. Без такой инфраструктуры обучение автопилота нового поколения (Full Self-Driving) упирается в лимиты времени и энергии.
Стоимость кластера в $300 млн — это плата за скорость. На фоне острейшего дефицита ускорителей H100, который длится уже более полугода, Tesla смогла получить крупную партию, что само по себе является сигналом о приоритетном статусе компании у NVIDIA. Тем не менее, зависимость от стороннего поставщика вынуждает компанию искать альтернативы.
Стратегия диверсификации: Dojo как план Б
Параллельно с эксплуатацией кластера на чипах NVIDIA, Tesla активно ведет разработку собственного суперкомпьютера Dojo. Проект, бюджет которого оценивается в $1 млрд, представляет собой полностью проприетарную архитектуру. Уже к октябрю следующего года компания планирует достичь производительности в 100 Эфлопс, что должно сделать Dojo самой мощной вычислительной системой в мире, превосходящей текущего лидера более чем в 60 раз.
Такая двойная стратегия позволяет компании снизить риски. Пока Dojo находится в стадии разработки, кластер на H100 решает текущие задачи обучения нейросетей. Когда Dojo будет запущен, Tesla получит не только независимость от поставок NVIDIA, но и архитектуру, оптимизированную именно под свои алгоритмы, что даст колоссальное преимущество в скорости обработки данных.
Ранее Tesla уже анонсировала, что намерена использовать вычислительные мощности не только для автопилота, но и для потенциального предоставления облачных услуг другим компаниям. Однако на данный момент приоритет остается за внутренними задачами, в первую очередь — за обработкой реальных сценариев обучения ИИ на огромных наборах данных.
Создание собственной вычислительной инфраструктуры такого масштаба меняет правила игры на рынке автономного вождения. В то время как конкуренты (Waymo, Cruise) часто полагаются на облачные сервисы Google или Amazon, Tesla получает полный контроль над всем циклом: от сбора данных с автомобилей до обучения модели. Это сокращает время на итерации и позволяет быстрее внедрять обновления в прошивки миллионов машин по всему миру. В долгосрочной перспективе именно доступ к уникальным вычислительным мощностям, а не только количество собранных данных, станет главным барьером для входа на рынок полноценного автопилота.















