Toyota научила роботов готовить завтраки, просто показав, как это делать

21 сен 2023, 10:41

431

Генеративный искусственный интеллект совершает прорыв в робототехнике, позволяя машинам осваивать сложные бытовые навыки без традиционного программирования. Исследовательский институт Toyota (TRI) представил новую методику обучения, которая сокращает время подготовки роботов к выполнению задач с месяцев до нескольких часов. Ключевым элементом этой революции стало не зрение, а осязание.

Тактильное обучение как основа нового подхода

Вместо того чтобы писать тысячи строк кода, инженеры TRI оснастили роботов специализированными датчиками, имитирующими чувство осязания. Эта сенсорная информация в связке с генеративной моделью ИИ позволяет машине «чувствовать» объекты и среду. Как отмечают исследователи, тактильная обратная связь дает роботу принципиально иной уровень понимания своих действий, делая его гораздо более эффективным, чем при использовании только камер. «Осязание является одним из ключевых факторов», — подчеркивают в лаборатории.

Как работает ночное обучение роботов

Процесс напоминает стажировку: человек-«учитель» демонстрирует роботу последовательность операций. После этого система анализирует полученные данные в фоновом режиме. «Мы обычно обучаем робота днём, позволяем ему учиться всю ночь, а на следующее утро приступаем к новому рабочему поведению», — поясняет сотрудник TRI Бен Берчфилд. Такой цикл позволяет машине не просто копировать движения, а адаптировать их под изменяющиеся условия.

От языковых моделей к моделям поведения

В основе технологии лежит концепция «больших моделей поведения» (Large Behavior Models, LBM). Аналогично тому, как нейросети (LLM) находят закономерности в тексте, LBM учатся через наблюдение и способны к обобщению. Вице-президент TRI Расс Тедрейк поясняет, что робот может применить навык, которому его никогда напрямую не учили. На данный момент таким способом освоено более 60 сложных операций, включая разлив жидкостей, работу с инструментами и манипуляции с деформируемыми предметами. Планы института амбициозны: к концу 2024 года довести количество освоенных навыков до тысячи.

Параллельно в этом направлении движется Google с моделью RT-2 (Robotics Transformer 2). Их система также использует накопленный опыт для принятия решений. Теоретически, такие роботы в будущем смогут выполнять задачи по общим командам вроде «очисти пол от пятна», не требуя детальных инструкций.

Работа по созданию подобных систем традиционно считалась «медленной и трудоёмкой». Сложность заключалась не только в сборе данных, но и в их репрезентативности — простой загрузки массивов информации из интернета для обучения физическим действиям недостаточно. Разработка датчиков осязания и алгоритмов их обработки стала тем самым недостающим звеном, которое превращает робота из слепого исполнителя в адаптивного помощника.

Успех TRI в обучении роботов приготовлению завтрака — лишь первый шаг. Эта технология имеет потенциал кардинально изменить промышленность и быт. Если раньше внедрение роботов требовало создания специальной инфраструктуры и длительного программирования, то теперь машины могут учиться на ходу, взаимодействуя с хаотичной и непредсказуемой средой, созданной для человека. Это приближает эру, когда роботы станут не просто инструментами, а полноценными партнерами в повседневной жизни.

Опубликовано: Мировое обозрение Источник