Ученые проверили глобальную ИИ-базу углеродных выбросов. Алгоритм ошибся на 70%
Учет выбросов парниковых газов — одна из самых сложных и масштабных задач современной науки. От того, насколько точно исследователи могут измерить объемы углекислого газа, поступающего в атмосферу, зависят триллионные бюджеты государств, стратегии развития крупнейших корпораций и планы по перестройке целых отраслей экономики. Транспортный сектор занимает в этой системе особое место: на него приходится огромная доля загрязнений, особенно в крупных городах, а отследить миллионы движущихся автомобилей гораздо сложнее, чем одну стационарную электростанцию.
Долгое время сбор таких данных проходил очень медленно, и зависел от местных отчетов. Но с развитием технологий появилась новая концепция: использовать искусственный интеллект и спутниковые снимки для автоматического мониторинга всей планеты в реальном времени. Эту идею воплотила коалиция Climate TRACE — проект, который позиционирует себя как независимый источник самых подробных данных о климатических выбросах. Проект предоставляет информацию о десятках тысяч регионов и пользуется доверием многих международных компаний.
Однако недавнее исследование, проведенное учеными из Университета Северной Аризоны, поставило под сомнение точность такого подхода. Исследователи проверили, насколько качественно алгоритмы Climate TRACE оценивают выбросы автомобильного транспорта в 260 городах США. Оказалось что данные спутникового мониторинга расходятся с реальными показателями в среднем на 70,4%. Этот разрыв показывает, что современные вычислительные модели пока не способны полностью заменить прямой сбор физических данных на местах.
Содержание
- Как работают два разных подхода к подсчету
- Три системные ошибки искусственного интеллекта
- Ограничения машинного зрения
- Значение для экологической политики
Как работают два разных подхода к подсчету
Чтобы понять причину столь серьезной ошибки, необходимо разобрать механику работы обеих систем оценки.
Методология Climate TRACE полностью опирается на дистанционное зондирование и машинное обучение. Спутники делают снимки земной поверхности с разрешением 10 на 10 метров. Нейросеть анализирует эти изображения и на основе визуальных признаков застройки пытается определить плотность дорожной сети и интенсивность трафика — то есть суммарный пробег всех автомобилей на конкретном участке. Затем система берет полученный километраж и умножает его на средние показатели расхода топлива по стране. Так формируется итоговая цифра выбросов углекислого газа.
Для проверки этих данных ученые использовали проект Vulcan. Это детальная научная модель, которая считается эталоном точности в США. В отличие от искусственного интеллекта, Vulcan работает с прямыми физическими измерениями. Система собирает информацию с дорожных датчиков, фиксирующих количество проезжающих машин. Она интегрирует базы данных регистрации транспортных средств, учитывает точный возраст автопарка в каждом конкретном округе, реальную скорость движения и даже влияние местной температуры воздуха на эффективность работы двигателей. Точность модели Vulcan регулярно подтверждается прямыми замерами концентрации углерода в атмосфере.
Когда исследователи наложили результаты Climate TRACE на карту городов и сравнили их с данными Vulcan, они обнаружили три системных сбоя в алгоритмах спутникового мониторинга.
Три системные ошибки искусственного интеллекта
Первая и самая масштабная проблема связана с искусственной корректировкой данных. В своей первоначальной версии нейросеть Climate TRACE довольно точно определяла сам объем трафика на дорогах. Но при выпуске обновления разработчики применили математический коэффициент масштабирования. Они сделали это для того, чтобы сумма их городских показателей совпадала с данными из глобального международного реестра выбросов. Попытка подогнать локальные цифры под общемировую статистику привела к серьезным искажениям: данные о трафике в конкретных городах стали расходиться с реальностью более чем на 92%. Ошибка показала, что глобальное усреднение разрушает точность на уровне отдельного муниципалитета.
Вторая проблема кроется в расчете расхода топлива. Climate TRACE применяет один и тот же национальный стандарт ко всем машинам, независимо от того, где они едут. Однако расход бензина или дизеля не может быть одинаковым везде. Он зависит от множества факторов: рельефа местности, плотности светофоров и технического состояния машин в регионе. Согласно данным Vulcan, реальный расход легковых автомобилей в городах составляет около 11,6 км на литр топлива. Алгоритмы Climate TRACE использовали устаревшие данные и заложили показатель в 8,9 км на литр. Считая, что машины тратят больше топлива, чем есть на самом деле, нейросеть автоматически и необоснованно завышала итоговые объемы выбросов углекислого газа.
Третий критический недостаток — игнорирование реального состава транспортного потока. Нейросеть, анализирующая спутниковые снимки, не видит разницы между тяжелым грузовиком и компактным легковым автомобилем. Чтобы обойти эту проблему, разработчики Climate TRACE заложили в алгоритм фиксированную пропорцию транспортных средств: определенный процент всегда отдается грузовикам, определенный — легковым машинам. Эта пропорция применяется одинаково ко всем городам. На практике, подтвержденной базами данных Vulcan, состав автопарка кардинально меняется от региона к региону. В промышленных зонах концентрация грузовиков в разы выше, чем в спальных районах или финансовых центрах. Так как тяжелый транспорт производит значительно больше выбросов, жесткая математическая пропорция искажает реальную картину загрязнений.
Ограничения машинного зрения
Исследование выявило и чисто технические ограничения спутникового мониторинга. Оказалось, что качество работы алгоритма напрямую зависит от типа застройки, которую он анализирует. Искусственный интеллект был обучен на снимках плотной городской среды, где преобладают асфальт и бетон. Когда нейросеть начинает анализировать окраины и пригороды, где больше открытого грунта, деревьев и неплотной застройки, она теряет точность. Спектральные характеристики изображения меняются, и алгоритм систематически недооценивает количество дорог и машин в таких районах.
Отдельное опасение ученых вызывает тот факт, что нейросеть Climate TRACE обучалась исключительно на данных дорожных сетей США. Авторы исследования предупреждают: если применить эту модель к странам с совершенно иной транспортной инфраструктурой, градостроительными стандартами и культурой вождения, погрешность в вычислениях может возрасти многократно.
Значение для экологической политики
Стремление создать полностью автоматизированную систему контроля за состоянием планеты понятно. Технологии дистанционного зондирования обладают огромным потенциалом, и они способны дать независимую оценку там, где страны или корпорации могут скрывать реальные данные о своих выбросах.
Тем не менее, отчет Университета Северной Аризоны фиксирует важный факт: на данном этапе развития технологий искусственный интеллект не может компенсировать отсутствие детальной физической информации. Ошибка в 70% делает данные непригодными для серьезного планирования на местном уровне.
Если управление города будет разрабатывать план по снижению выбросов, опираясь на искаженные алгоритмические данные, она может принять неверные решения. Финансирование пойдет на борьбу с несуществующими проблемами, в то время как реальные источники загрязнений останутся без внимания. Для управления экологическими процессами требуется максимальная точность, которую пока способна обеспечить только детальная интеграция спутниковых наблюдений с базами данных, собираемыми непосредственно на земле.
Источник:Environmental Research Letters
