Goblin News 146: переговоры России и Украины, Индия и Пакистан, лидеры Европы и кокаин
Энергетический аппетит нейросетей: почему старые модели не работают
Основная проблема кроется в фундаментальной неэффективности современных алгоритмов. Каждый запрос к большой языковой модели (LLM) требует в десятки раз больше энергии, чем стандартный поисковый запрос. При этом производители чипов, такие как NVIDIA и AMD, наращивают производительность GPU, но рост энергопотребления на единицу вычислений замедляется, упираясь в физические ограничения кремниевых транзисторов.
Параллельно растет нагрузка на системы охлаждения. Традиционные воздушные системы уже не справляются с тепловыделением новейших чипов — плотность мощности на стойку в современных дата-центрах достигает 50-70 кВт, что требует перехода на жидкостное охлаждение. Без этого серверы просто выходят из строя из-за перегрева.
Поиск выхода: от квантовых экспериментов до «голых» металлов
Индустрия ищет выход сразу в нескольких направлениях. Во-первых, это переход на специализированные ASIC-чипы (специализированные интегральные схемы), которые выполняют только одну задачу, но делают это с максимальной энергоэффективностью. Во-вторых, активно развивается направление «аналоговых» вычислений, где данные обрабатываются не в двоичном коде, а в виде непрерывных сигналов, что радикально снижает энергопотребление.
Однако самым перспективным, но пока экспериментальным направлением остаются квантовые вычисления. Теоретически, кубиты способны решать задачи, которые современным суперкомпьютерам потребовали бы годы работы, за секунды. Проблема в том, что квантовые системы требуют экстремального охлаждения (до температур, близких к абсолютному нулю) и крайне нестабильны.
Параллельно технологические гиганты, включая Google и Microsoft, инвестируют миллиарды в строительство собственных атомных электростанций малой мощности (SMR) для питания своих кластеров. Это вызывает ожесточенные споры в обществе о безопасности и экологичности такого подхода.
В преддверии кризиса уже сейчас наблюдается гонка за патентами на методы «углеродно-нейтрального» обучения нейросетей. Ранее подобные инициативы воспринимались как пиар-акции, однако теперь, когда счета за электричество для дата-центров начинают превышать затраты на оборудование, экономика заставляет пересмотреть приоритеты. Ученые из Стэнфорда и MIT уже опубликовали исследования, показывающие, что оптимизация архитектуры сети (прунинг и квантизация) может снизить энергопотребление на 40-60% без потери точности ответов. Этот энергетический кризис станет катализатором для смены технологического уклада. Если в ближайшие 3-5 лет не появится рыночных решений по снижению энергоемкости ИИ, человечество может оказаться перед дилеммой: либо замедление развития технологий, либо возврат к угольной генерации, что сведет на нет все усилия по борьбе с изменением климата. Фактически, мы стоим на пороге «энергетического барьера» — нового рубежа, который определит, сможет ли ИИ стать действительно массовым инструментом или останется уделом элит с доступом к дешевой энергии.
