В MIT создали систему планирования задач для домашних роботов
Инженеры Массачусетского технологического института (MIT) представили технологию, которая способна радикально сократить время, необходимое роботу для адаптации к хаотичной домашней среде. Разработка, получившая название PIGINet, решает ключевую проблему бытовой робототехники — неспособность машин быстро ориентироваться в постоянно меняющихся интерьерах. Вместо того чтобы каждый раз перестраивать маршрут с нуля, система учится прогнозировать, какие действия будут выполнимы, а какие — нет, экономя до 80% вычислительных ресурсов. Это открывает путь к созданию по-настоящему автономных домашних ассистентов, способных не просто следовать инструкции, но и адаптироваться к реальности.
Как нейросеть учится предвидеть хаос
Человеческое жилье — одна из самых сложных сред для автономных систем. В отличие от складов или производственных цехов с их строгой логикой и статичным расположением объектов, квартиры и дома представляют собой динамичную экосистему. Мебель переставляют, вещи разбрасывают, а дверцы шкафов могут быть открыты или закрыты. Для большинства современных роботов, даже таких привычных, как пылесосы, каждое такое изменение требует пересчета всего маршрута. Разработчики из Лаборатории компьютерных наук и искусственного интеллекта (CSAIL) MIT предложили принципиально иной подход.
В основе платформы PIGINet лежит универсальный кодировщик-трансформер. Это архитектура нейросети, которая одновременно обрабатывает четыре типа данных: визуальные изображения (картинка с камеры), текстовое описание цели (например, «поставить тарелку в шкаф»), символьную кодировку исходного состояния (какие предметы где находятся) и сам план действий. «Входящей последовательностью является информация о том, какой план задач рассматривается, изображения среды, символьные кодировки исходного состояния и желаемая цель. Кодировщик объединяет планы задач, изображения и текст, чтобы составить прогноз относительно выполнимости выбранного плана», — пояснили авторы проекта. Проще говоря, нейросеть смотрит на изображение кухни, понимает, что дверца шкафа заблокирована стулом, и сразу отбрасывает сценарий, предполагающий открытие этой дверцы, не тратя время на его просчет.
Эффективность на кухне: от 50% до 80% экономии времени
В текущей версии система сфокусирована на кухонном пространстве. Это наиболее сложный с точки зрения навигации участок дома: здесь много мелких предметов, открытых и закрытых поверхностей, а также постоянное взаимодействие с водой и температурой. PIGINet моделирует рабочую среду, включающую стойки, шкафчики, холодильник и раковины. Тестовые испытания показали впечатляющие результаты: в большинстве рутинных операций время планирования задач сокращается на 80%. В более запутанных сценариях, где требуется учитывать множество пересекающихся объектов, экономия составляет от 20 до 50%. Это значит, что робот тратит меньше времени на «размышления» и больше — на выполнение полезной работы.
Бытовые роботы, от пылесосов до автоматических газонокосилок, десятилетиями борются с неструктурированной средой. Однако PIGINet меняет саму парадигму: вместо того чтобы пытаться идеально картировать пространство, она учится оценивать вероятность успеха того или иного действия. Это сближает машинное планирование с человеческим мышлением — мы тоже не просчитываем каждый шаг, а опираемся на предыдущий опыт и визуальную оценку ситуации.
Разработчики ставят перед собой еще более амбициозную задачу. В перспективе система должна научиться не просто отклонять невыполнимые задачи, а предлагать альтернативные сценарии. Если робот не может открыть шкаф, потому что он занят, он должен предложить убрать мешающий предмет или выбрать другой шкаф. Такой подход в корне изменит процесс обучения роботов: от жесткого программирования под каждый тип помещения они перейдут к генеративному планированию, адаптируясь к условиям конкретного дома в реальном времени. Это может стать тем самым прорывом, который сделает домашних андроидов не экзотикой, а привычным элементом быта.















