Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление

14 окт 2024, 03:59

Искусственный интеллект от ведущих мировых лабораторий, включая Apple, продемонстрировал шокирующую уязвимость: добавление в условие математической задачи незначительной детали, которую человек проигнорировал бы автоматически, приводит нейросеть к гарантированной ошибке. Новое исследование ставит под сомнение саму концепцию «мышления» больших языковых моделей (LLM) и указывает на то, что современный ИИ — это лишь сложный механизм подражания, а не интеллект.

Иллюзия логики: почему нейросети не видят сути

В научной работе, озаглавленной «Понимание ограничений математического мышления в больших языковых моделях», специалисты Apple провели серию тестов, которые обнажили фундаментальную проблему. Выяснилось, что LLM способны успешно справляться с прямыми арифметическими вычислениями, однако любое отвлекающее условие, не имеющее отношения к математике, ломает алгоритм.

Эксперимент с киви: как нейросеть «испугалась» размера фрукта

Классический пример из исследования: модели без труда дают правильный ответ на задачу: «Оливер собрал 44 киви в пятницу, 58 — в субботу, а в воскресенье — вдвое больше, чем в пятницу. Сколько всего киви?». Однако стоит лишь добавить в условие фразу «в воскресенье 5 из этих киви были немного меньше среднего размера», как нейросеть начинает вычитать эти 5 штук из общей суммы. Для человека очевидно, что размер плода не влияет на подсчет количества, но для ИИ это — непреодолимый семантический шум.

Мнение эксперта: «Это не разум, а шаблон»

Мехрдад Фараджтабар, один из соавторов публикации, прямо заявляет: подобные сбои доказывают, что модели не понимают логику задачи. Вместо осмысленного анализа они просто воспроизводят последовательности действий, которые видели в обучающих данных. «Мы предполагаем, что это снижение эффективности связано с тем, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги, наблюдаемые в их обучающих данных», — отмечается в статье.

Спор о методах: может ли инженерия запросов спасти ситуацию?

ных данных, чтобы нейтрализовать отвлекающие факторы. Ребенок справляется с этой задачей мгновенно, в то время как нейросеть требует колоссальных вычислительных ресурсов для «обмана» собственных алгоритмов.

Последние несколько лет индустрия активно продвигала тезис о том, что масштабирование вычислительных мощностей и объемов данных приведет к появлению у машин настоящего интеллекта. Однако данное исследование демонстрирует, что простого увеличения параметров недостаточно. Системы остаются крайне чувствительными к форме подачи информации, а не к ее смыслу.

На практике это означает, что полагаться на LLM в задачах, требующих причинно-следственного анализа или работы с неоднозначными вводными, пока крайне рискованно. Для бизнеса и разработчиков это сигнал о необходимости внедрения дополнительных верификационных слоев, которые будут отсеивать «шум» перед передачей данных нейросети. Вопрос о том, способны ли языковые модели к рассуждению, остается открытым, но текущие данные свидетельствуют: до появления машин, которые действительно мыслят, а не имитируют мышление, предстоит пройти еще долгий путь.

Опубликовано: Мировое обозрение Источник

Постпред США при НАТО Уитакер назвал Украину «боевой лабораторией будущего»

Трамп раскрыл детали разговора с Зеленским

«12 лет не было «майдана» — и вдруг»: В МИД РФ раскрыли, как на Украине за часы запускают протесты

Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление

Иллюзия логики: почему нейросети не видят сути

Эксперимент с киви: как нейросеть «испугалась» размера фрукта

Мнение эксперта: «Это не разум, а шаблон»

Спор о методах: может ли инженерия запросов спасти ситуацию?

Подписывайтесь:

Топ за неделю

Украина потеряла ещё один F-16: Истребитель рухнул из-за «нештатной ситуации» в воздухе

Украинские БПЛА снова долетели до Башкирии. На НПЗ в Туймазах пожар

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

«А еще по спиртзаводам, Мавзолею и Останкинской башне». Тука призывает нанести удары по табачным фабрикам в России

В Белгороде в результате атаки дрона по АЗС погиб секретарь местного горкома Александр Логвинов

Защитил опытные поля ценой жизни: после жестокого избиения родителями подростков скончался член-корреспондент РАН Никита Зезин

На Западе напомнили, что Россия может ударить «Орешником» по любой точке в Европе

ВСУ ракетой «Фламинго» атаковали завод «Авиатэк» в Кирове

Украина потеряла ещё один F-16: Истребитель рухнул из-за «нештатной ситуации» в воздухе

Украина должна исчезнуть

Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление

Иллюзия логики: почему нейросети не видят сути

Эксперимент с киви: как нейросеть «испугалась» размера фрукта

Мнение эксперта: «Это не разум, а шаблон»

Спор о методах: может ли инженерия запросов спасти ситуацию?

Подписывайтесь:

Топ за неделю

Последние новости

Согласие на использование файлов cookie