ChatGPT, Gemini и Claude по-разному оценили, какие профессии исчезнут из-за ИИ — учёные усомнились в надёжности прогнозов

11 май 2026, 14:54

Почему ИИ-модели не могут договориться о том, кого заменят: разбор расхождений

Три мощные языковые модели — ChatGPT-5, Gemini 2.5 и Claude 4.5 — получили одно и то же задание: оценить, каким профессиям больше всего угрожает автоматизация. Ответы разошлись. И это не просто технический курьёз. На такие оценки ориентируются политики, HR-департаменты и даже вузы, когда решают, какие специальности сокращать. Но можно ли верить этим цифрам? Спойлер: с большой осторожностью.

Экономисты из Северо-Западного и Американского университетов (Мишель Инь, Хоа Ву, Клаудия Персико) провели эксперимент. Они попросили каждую модель оценить уязвимость нескольких десятков профессий. И вот что выяснилось.

Как модели разошлись во мнениях

Возьмём бухгалтеров. Claude присвоил им высокую уязвимость. Gemini — заметно ниже. Рекламные менеджеры? Те же разногласия. Руководители высшего звена — одни модели считают их почти неуязвимыми, другие — умеренно уязвимыми. ChatGPT и Gemini оказались ближе друг к другу, но даже они расходились примерно в 25% случаев.

Почему это происходит? Частично — из-за различий в архитектуре моделей и обучающих данных. Но есть и менее очевидная причина.

Проблема в том, что некоторые политики и работодатели могут принимать такие оценки за чистую монету. — исследователи

Эффект первых пользователей: кто генерирует данные, тот и влияет на прогноз

Вот интересный факт, о котором редко говорят. На оценку профессии влияет то, насколько активно её представители уже используют ИИ. Финансовые аналитики массово работают с нейросетями — это генерирует огромные массивы данных. Модели обучаются на этих данных и «видят» аналитиков как более уязвимых. А профессии, где ИИ пока не внедрён, остаются «тёмной лошадкой». Получается замкнутый круг: чем больше людей пользуются ИИ, тем выше вероятность, что модель предскажет замену именно этой профессии. Логично? Не очень.

Я сам недавно заметил, как в одном консалтинговом отчёте ссылались на одиночный индекс от ChatGPT как на «объективный прогноз». При этом авторы даже не упомянули, что другие модели дают другие цифры. Такое слепое доверие пугает.

Три способа измерить угрозу — и все с изъянами

Индексы подверженности ИИ сейчас строят тремя методами. Важно понимать слабости каждого.

Метод	Как работает	Главные недостатки
Ручная экспертиза	Эксперты вручную оценивают, насколько ИИ ускоряет задачи	Субъективно, медленно, зависит от кругозора эксперта
Опросы пользователей	Сотрудников платформ (например, Copilot) спрашивают, как ИИ меняет их работу	Выборка смещена — только те, кто уже пользуется ИИ. Не отражает весь рынок
Большие языковые модели (LLM)	Пишут промпт вроде «оцени риск автоматизации профессии X»	Расхождения между моделями, нестабильность ответов, зависимость от обучающих данных

Каждый метод даёт свою картинку. Но политики и бизнес часто берут один «удобный» индекс и выдают его за истину. Между тем, по словам авторов исследования, более точную информацию дают опросы о реальном внедрении ИИ в экономику — что конкретно делают с нейросетями, для каких задач.

Микроинструкция: как не дать себя обмануть ИИ-прогнозами

Вот простой алгоритм, если вы хотите оценить риски для своей профессии или для бизнеса.

Не верьте одной модели. Сравните ответы ChatGPT, Gemini, Claude. Если они расходятся — значит, неопределённость высокая.
Узнайте, на каких данных обучена модель. Если в обучающую выборку попали в основном финансисты, то её прогноз по другим отраслям будет слабым.
Посмотрите на реальное внедрение. Есть ли кейсы, когда ИИ уже заменяет людей в вашей сфере? Опросы отраслевых ассоциаций часто полезнее, чем оценки LLM.
Не принимайте судьбоносных решений на основе одного индекса. Как сказала Мишель Инь: «Я бы не стала полагаться на один показатель, чтобы решать: мне надо сменить работу».

Резюме от автора

Модели вроде ChatGPT — мощный инструмент, но не оракул. Пока они не способны дать единый, надёжный прогноз по автоматизации. Индексы подверженности ИИ — это сырые оценки, а не инструкция к действию. Доверять им стоит только после перекрёстной проверки. А лучше — следить за тем, как ИИ реально внедряется в вашей отрасли. Это даст гораздо больше, чем любой алгоритм.

Опубликовано: Мировое обозрение Источник