Boston Dynamics рассказала, как человекоподобный робот Atlas «видит» окружающий мир
Как робот Atlas учится видеть: разбор системы восприятия Boston Dynamics
Промышленные манипуляторы давно умеют брать детали. Но только если эти детали идеально освещены и лежат в строго определённом месте. Робот Atlas от Boston Dynamics делает то, что раньше казалось фантастикой: он самостоятельно находит, хватает и устанавливает автозапчасти в реальном цеху. Причём справляется даже с блестящими или чёрными деталями, которые оптические датчики обычно «не видят». Как это устроено — разберёмся без рекламных обещаний.
Почему камерам робота так тяжело?
На заводе детали бывают глянцевыми, тёмными, низкоконтрастными. Обычные камеры сляпают – теряют границы объекта. Atlas решает эту проблему комбинацией методов. Сначала — детекция. Система на основе нейросети находит на изображении ограничивающие рамки и ключевые точки. Но этого мало — нужно ещё понять, где деталь лежит: на столе, в глубоком ящике или на движущемся конвейере. Boston Dynamics использует облегчённую архитектуру сети, чтобы не перегружать бортовой компьютер. Компромисс между точностью и скоростью — иначе робот будет думать дольше, чем двигаться.
Личное наблюдение автора. Недавно на записи с завода я заметил, как Atlas сначала «зависает» на долю секунды, оценивая контейнер с хаотично сложенными кронштейнами. Он делает это быстрее, чем моргает человек. А ведь ещё пару лет назад такой уровень адаптивности был доступен только в лабораториях.
Точки интереса: внешние и внутренние
Чтобы не врезаться в стеллажи, Atlas строит карту окружения. Он выделяет два типа точек интереса:
| Тип точки | Цвет | Назначение |
|---|---|---|
| Внешние | Зелёные | Огибать препятствия (стойки, стены, оборудование) |
| Внутренние | Красные | Маркеры полок, ящиков, точное расположение объектов |
Внутренних точек больше — они позволяют локализовать даже мелкий крепёж. Сетка ключевых точек сшивается с предварительной CAD-моделью цеха. Если модель устарела (поставили новый стеллаж), Atlas подстраивается на лету через обратную связь от камер. Это и есть адаптивное восприятие.
Локализация в пространстве: где я и где деталь?
Алгоритм SuperTracker объединяет данные с энкодеров суставов (знает, где находятся захваты) и изображения с камер. Если деталь выходит из поля зрения — например, робот уже взял её и несёт — он использует кинематическую одометрию. Система продолжает «держать в голове» положение предмета, даже когда камера его не видит. Это критично для точной установки: отклонение в 2–3 сантиметра — и деталь упадёт.
Точная калибровка сенсоров — фундамент. Без неё все алгоритмы бесполезны. Boston Dynamics заявляет, что калибруют каждую камеру и каждый сустав с субмиллиметровой точностью. И это не маркетинг — иначе Atlas просто не смог бы закручивать болты в автоматическом режиме.
Как это работает: пошаговый процесс сборки
- Обнаружение. Камера находит деталь, нейросеть определяет её класс и габаритную рамку.
- Локализация. SuperTracker совмещает 2D-изображение с 3D-моделью объекта (CAD-чертёж). Генерируется несколько гипотез захвата, выбирается оптимальная.
- Захват. Используется оценка по монокулярному изображению с рендерингом — Atlas виртуально «накладывает» модель на реальную деталь.
- Перенос. Кинематическая одометрия корректирует траекторию, если деталь скрыта за препятствием.
- Установка. Система сравнивает рендер с реальным видео, добиваясь совпадения до долей миллиметра.
Весь цикл занимает меньше секунды. Работает на сотнях заводских объектов, предварительно оттекстурированных в CAD. Если объект новый — система обобщает знания с нулевого кадра, используя только геометрию.
Что дальше: от восприятия к единой модели
Сейчас восприятие и действие у Atlas — это два отдельных конвейера. Boston Dynamics хочет объединить их в одну базовую модель. Тогда робот будет не сначала смотреть, потом двигать, а делать это параллельно. Это снизит задержки и позволит работать в динамичных средах — например, на движущемся конвейере. Но пока это будущее. А сегодня Atlas уже умеет то, что не под силу 99% промышленных роботов: поднимать упавшую деталь, менять хватку на лету и адаптироваться к новому стеллажу без перепрограммирования.
Моё мнение. Система SuperTracker и метод рендеринга для оценки позы — действительно прорывные. Но главное — это не софт, а грамотная калибровка. Boston Dynamics потратила годы на то, чтобы каждый сустав и камера работали как единый организм. Повторить такую точность в домашнем роботе пока невозможно — слишком дорогие датчики и механика. Зато на заводе это окупается снижением брака и ускорением сборки.

