Пользователь больше не нужен — новая ИИ-модель Anthropic сама управляет ПК

22 окт 2024, 23:08

Anthropic выпустила обновление своей флагманской модели Claude 3.5 Sonnet, наделив её способностью напрямую управлять компьютером. В отличие от обычных чат-ботов, новая версия может самостоятельно перемещать курсор, кликать по кнопкам и вводить текст в любых десктопных приложениях, имитируя действия человека. Компания позиционирует это как шаг к созданию «агента ИИ» — алгоритма, способного автономно выполнять офисные задачи и автоматизировать рутинные бизнес-процессы.

Как ИИ получает контроль над рабочим столом

По заявлению разработчиков, Claude 3.5 Sonnet обучен анализировать скриншоты экрана в реальном времени. Система просчитывает, на сколько пикселей нужно сдвинуть курсор, чтобы нажать на нужный элемент интерфейса. Пользователь задаёт задачу текстовой подсказкой (например, «заполнить форму данными из этого файла»), а нейросеть самостоятельно разбивает её на последовательность команд: перемещение, клик, ввод текста. Рынок уже насыщен подобными решениями: Microsoft, Salesforce и стартапы вроде Rabbit предлагают собственных агентов для автоматизации. Однако Anthropic утверждает, что их модель превосходит конкурентов по надёжности. В тестах на бенчмарке SWE-bench Verified Claude 3.5 Sonnet показала лучшие результаты в задачах по кодированию, чем флагманский o1 от OpenAI. Система способна самостоятельно корректировать ошибки и выполнять цепочки из сотен последовательных действий.

Слабые места и риски новой технологии

Несмотря на заявленную мощь, тесты выявили серьёзные ограничения. В эксперименте с бронированием авиабилетов модель успешно справилась менее чем с половиной задач. При возврате билетов ошибки возникали в каждом третьем случае. Anthropic признаёт, что ИИ испытывает трудности с базовыми операциями вроде прокрутки страниц и масштабирования, а также может пропускать всплывающие уведомления из-за особенностей обработки скриншотов. Главная проблема — безопасность. Исследования показывают, что даже модели без прямого доступа к управлению ПК могут быть использованы для вредоносных действий, например, заказа поддельных документов через даркнет. Предоставление ИИ прямого доступа к рабочему столу многократно увеличивает потенциальный ущерб: злоумышленники могут использовать уязвимости приложений для кражи данных или компрометации системы. Anthropic осознаёт эти риски. Компания внедрила классификаторы, блокирующие высокорисковые действия (публикации в соцсетях, создание аккаунтов, доступ к госресурсам). Все скриншоты, сделанные во время работы, хранятся не менее 30 дней. Однако разработчики прямо заявляют, что «не существует надёжных методов» защиты, и рекомендуют изолировать Claude от особо конфиденциальных данных.

Планы на будущее и доступность

Одновременно с запуском Claude 3.5 Sonnet компания анонсировала выход обновлённой версии Claude 3.5 Haiku — более лёгкой и быстрой модели, ориентированной на обработку больших массивов данных (история покупок, цены, инвентаризация). Haiku пока доступна только как текстовая модель, но позже получит мультимодальные функции. Выпуск Claude 3.5 Opus, самой мощной модели семейства, отложен на неопределённый срок. По данным опроса Capgemini, 10% организаций уже используют агентов ИИ, а 82% планируют внедрить их в ближайшие три года. Разработчики могут протестировать Computer Use через API Anthropic, Amazon Bedrock и Vertex AI от Google Cloud. Рынок агентов ИИ переходит от концептуальных обсуждений к реальному внедрению. Anthropic делает ставку на безопасность и контролируемый доступ, но история показывает, что любые инструменты автоматизации становятся мишенью для злоумышленников. Вопрос не в том, появятся ли инциденты, а в том, насколько быстро индустрия сможет выработать стандарты защиты, прежде чем первый крупный взлом нанесёт серьёзный ущерб.

Опубликовано: Мировое обозрение Источник