Все об оценке энергетического и экологического следа искусственного интеллекта
Оценка энергопотребления и выбросов ИИ: сложности, неизвестные и результаты исследования MIT Technology Review о влиянии искусственного интеллекта на энергетику.
Оценка Энергопотребления и Выбросов от ИИ: Сложности и Подводные Камни
Оценка энергетического следа и выбросов, связанных с искусственным интеллектом (ИИ), представляет собой сложную задачу, сопряженную с множеством неопределенностей. Доступные данные часто неполны, а многие ключевые переменные остаются скрытыми. Попытки оценить как индивидуальное, так и коллективное энергопотребление ИИ наталкиваются на серьезные препятствия.
Оценка энергопотребления моделей ИИ существенно отличается от оценки топливной экономичности автомобилей или энергоэффективности бытовой техники. Не существует общепринятых методик или общедоступных баз данных, позволяющих проводить сравнения. Отсутствуют обязательные к исполнению стандарты, что затрудняет для потребителей сравнение различных моделей ИИ по этому параметру.
Несмотря на значительные инвестиции в энергетическую инфраструктуру, ориентированную на удовлетворение потребностей ИИ, единого, общепризнанного способа количественной оценки энергопотребления ИИ до сих пор не разработано. Кроме того, компании, занимающиеся разработкой и внедрением ИИ, часто не склонны раскрывать информацию о своих показателях энергоэффективности.
Оценка выбросов, связанных с энергопотреблением ИИ, также представляет собой непростую задачу из-за сложной и постоянно меняющейся структуры современных энергосистем. При расчете последствий использования ИИ необходимо учитывать множество переменных, допущений и ограничений.
Как Измерить Энергию, Потребляемую Моделью ИИ?
Компании, разрабатывающие "закрытые" модели ИИ, такие как OpenAI, обычно предоставляют доступ к своим системам через пользовательские интерфейсы. Пользователь вводит запрос и получает ответ, но что происходит "под капотом" – в каком дата-центре обрабатывается запрос, сколько энергии на это тратится и какова углеродоемкость используемых источников энергии – остается скрытым.
Компании, как правило, не заинтересованы в раскрытии этой информации, что затрудняет объективный анализ энергопотребления ИИ. В таких случаях для анализа приходится использовать открытые модели, хотя они и являются несовершенным, но лучшим доступным приближением. Следует отметить, что OpenAI, Microsoft и Google отказались предоставить конкретные данные об энергопотреблении своих "закрытых" моделей.
Лучшие Ресурсы для Оценки Энергопотребления Открытых Моделей ИИ
Ключевыми ресурсами для оценки энергопотребления открытых моделей ИИ являются AI Energy Score, ML.Energy и MLPerf Power. Команды ML.Energy и AI Energy Score оказывают неоценимую помощь в расчетах для текстовых, графических и видеомоделей, предоставляя ценные данные и методологии.
Этапы Энергопотребления ИИ: Обучение и Вывод
Модели ИИ потребляют энергию на двух основных этапах: при обучении на больших объемах данных и при ответе на запросы пользователей (вывод). Несколько лет назад основное внимание уделялось энергопотреблению на этапе обучения, поскольку компании стремились создавать все более крупные и сложные модели.
В настоящее время, однако, наибольшая часть энергии, потребляемой ИИ, приходится на этап вывода, когда модель непосредственно используется для решения задач. Наиболее точный способ определить энергопотребление модели ИИ на этапе вывода – измерить количество электроэнергии, потребляемой сервером, обрабатывающим запрос.
Серверы, используемые для работы ИИ, содержат множество компонентов, включая мощные графические процессоры (GPU), выполняющие основную вычислительную работу, центральные процессоры (CPU), системы охлаждения и другие элементы. Исследователи обычно измеряют энергопотребление GPU, поскольку именно этот компонент потребляет большую часть энергии.
и оценивают энергопотребление остальных компонентов.Оценка Энергопотребления: Подход ML.Energy
Команда ML.Energy использует набор из 500 запросов для тестирования моделей. Оборудование остается неизменным, используется популярный GPU Nvidia H100. Для анализа были выбраны модели семейства Meta Llama трех размеров: малая (8 миллиардов параметров), средняя (70 миллиардов) и большая (405 миллиардов).
Также был определен набор запросов для тестирования и сравнения со средними показателями для всей выборки из 500 запросов. Для оценки использовались научные работы, включая исследование Microsoft 2024 года, чтобы определить долю GPU в общем энергопотреблении сервера. Оказалось, что она составляет около половины. Поэтому оценка энергопотребления GPU была удвоена для получения общей оценки энергопотребления.
Энергопотребление Моделей Генерации Изображений
Stable Diffusion 3 от Stability AI – одна из наиболее распространенных моделей генерации изображений с открытым исходным кодом. Поэтому она была выбрана в качестве объекта анализа.
Хотя мы протестировали несколько размеров текстовой модели Meta Llama, мы сосредоточились на одном из самых популярных размеров Stable Diffusion 3 с 2 миллиардами параметров. Команда использует набор примеров запросов для тестирования энергетических требований модели. Хотя энергия, используемая большими языковыми моделями, частично определяется запросом, это не относится к диффузионным моделям. Диффузионные модели могут быть запрограммированы на прохождение предписанного количества "шагов шумоподавления" при генерации изображения или видео, причем каждый шаг представляет собой итерацию алгоритма, который добавляет больше деталей к изображению. Для заданного количества шагов и модели все сгенерированные изображения имеют одинаковый энергетический след. Чем больше шагов, тем выше качество конечного результата, но тем больше энергии используется. Количество шагов варьируется в зависимости от модели и приложения, но 25 — довольно распространенное число, и это то, что мы использовали для нашего стандартного качества. Для более высокого качества мы использовали 50 шагов.Мы упоминали, что...
Мы упоминали, что графические процессоры обычно отвечают примерно за половину энергопотребления запросов больших языковых моделей. Недостаточно исследований, чтобы знать, как это меняется для диффузионных моделей, генерирующих изображения и видео. В отсутствие лучшей оценки, и после консультаций с исследователями, мы решили придерживаться этого эмпирического правила 50% и для изображений, и для видео. Видеомодели, которые тестировали Chung и Chowdhury, были только теми, которые генерируют короткие GIF-файлы низкого качества. Мы не думаем, что видео, которые производят эти модели, отражают точность сгенерированного ИИ видео, которое привыкли видеть многие люди. Вместо этого мы обратились к Саше Луккиони, руководителю отдела ИИ и климата в Hugging Face, которая руководит проектом AI Energy Score. Она измеряет энергию, используемую графическим процессором во время запросов ИИ. Мы выбрали две версии модели CogVideoX для тестирования: более старую, более низкого качества, и более новую, более высокого качества. Мы попросили Луккиони использовать свой инструмент под названием Code Carbon для тестирования обеих и измерения результатов пакета выбранных нами видеозапросов, используя то же оборудование, что и наши тесты текста и изображений, чтобы сохранить как можно больше переменных одинаковыми. Она сообщила о потребностях графического процессора в энергии, которые мы снова удвоили, чтобы оценить общие потребности в энергии.Отслеживание происхождения этой энергии
После того, как мы поймем, сколько энергии требуется для ответа на запрос, мы сможем преобразовать это в общее воздействие на выбросы. Для этого необходимо взглянуть на энергосистему, из которой центры обработки данных получают электроэнергию. Определение воздействия энергосистемы на климат может быть сложным, поскольку она одновременно взаимосвязана и невероятно локальна. Представьте себе энергосистему как систему соединенных каналов и бассейнов с водой. Электростанции добавляют воду в каналы, а потребители электроэнергии, или нагрузки, выкачивают ее. В США взаимосвязи энергосистемы простираются по всей стране. Так что, в некотором смысле, мы все связаны, но мы также можем разбить энергосистему на составные части, чтобы получить представление о том, как источники энергии различаются по стране.Понимание углеродоемкости
Ключевой показатель, который здесь нужно понимать, называется углеродоемкостью, которая, по сути, является мерой того, сколько граммов загрязнения углекислым газом выбрасывается на каждый киловатт-час произведенной электроэнергии. Чтобы получить данные об углеродоемкости, мы обратились в Electricity Maps, датскую стартап-компанию, которая собирает данные об энергосистемах по всему миру. Команда собирает информацию из таких источников, как правительства и коммунальные предприятия, и использует ее для публикации исторических и актуальных оценок углеродоемкости энергосистемы. Вы можете узнать больше об их методологии здесь. Компания поделилась с нами историческими данными за 2024 год, как для всех США, так и для нескольких ключевых балансирующих органов (подробнее об этом чуть позже). После обсуждений с основателем Electricity Maps Оливье Корради и другими экспертами, мы приняли несколько решений о том, какие цифры мы будем использовать в наших расчетах. Один из способов измерения углеродоемкости — просто посмотреть на все электростанции, которые работают в энергосистеме, сложить загрязнение, которое они производят в данный момент, и разделить эту сумму на производимую ими электроэнергию. Но это не учитывает выбросы, связанные со строительством и демонтажем электростанций, которые могут быть значительными. Поэтому мы решили использовать показатели углеродоемкости, которые учитывают весь жизненный цикл электростанции. Мы также решили использовать углеродоемкость энергии, основанную на потреблении, а не на производстве. Этот показатель учитывает импорт и экспорт между различными частями энергосистемы и лучше всего представляет электроэнергию, которая используется в режиме реального времени в данном регионе. Для большинства расчетов, которые вы видите в истории, мы использовали среднюю углеродоемкость для США за 2024 год, согласно Electricity Maps, которая составляет 402,49 грамма эквивалента углекислого газа на киловатт-час.Понимание балансирующих органов
Хотя понимание общей картины по всем США может быть полезным, в разных местах энергосистема может выглядеть совершенно по-разному. Один из способов разбить данные на части — это рассмотреть балансирующие органы. Это независимые организации, ответственные за балансировку энергосистемы в определенном регионе. Они работают в основном независимо, хотя между ними постоянно происходит перемещение электроэнергии. В США существует 66 балансирующих органов, и мы можем рассчитать углеродоемкость для части энергосистемы, охватываемой конкретным балансирующим органом. Electricity Maps предоставила данные об углеродоемкости для нескольких ключевых балансирующих органов, и мы сосредоточились на нескольких, которые играют наибольшую роль в работе центров обработки данных. ERCOT (который охватывает большую часть Техаса) и PJM (группа штатов на Восточном побережье, включая Вирджинию, Пенсильванию и Нью-Джерси) — два региона с наибольшей нагрузкой на центры обработки данных, согласно исследованиям Гарвардской школы общественного здравоохранения. Мы добавили CAISO (в Калифорнии), потому что он охватывает самый густонаселенный штат в США. CAISO также управляет энергосистемой со значительным количеством возобновляемых источников энергии, что делает его хорошим примером того, как углеродоемкость может резко меняться в зависимости от времени суток. (Например, в середине дня преобладает солнечная энергия, а ночью большую роль играет природный газ.) Важное предостережение здесь заключается в том, что мы не совсем уверены, куда компании обычно отправляют отдельные запросы на вывод данных ИИ.Расположение центров обработки данных
В выбранных нами регионах есть кластеры центров обработки данных, но когда вы используете модель ИИ технологического гиганта, ваш запрос может обрабатываться любым количеством центров обработки данных, принадлежащих компании или работающих по контракту с ней. Разумное приближение — это местоположение: вероятно, что центр обработки данных, обслуживающий запрос, находится недалеко от места, где он был сделан, поэтому запрос на Западном побережье, скорее всего, будет направлен в центр обработки данных на этой стороне страны. Чтобы лучше контекстуализировать наши расчеты, мы ввели несколько сравнений, с которыми люди могут быть более знакомы, чем киловатт-часы и граммы углекислого газа.Контекстуализация данных
В нескольких местах мы взяли количество электроэнергии, которое, по оценкам, используется моделью, и рассчитали, как долго эта электроэнергия сможет питать стандартную микроволновую печь, а также какое расстояние можно проехать на электровелосипеде. В случае с электровелосипедом мы предположили эффективность 25 ватт-часов на милю, что входит в диапазон часто упоминаемых показателей эффективности для велосипеда с педальным приводом. Для микроволновой печи мы предположили модель мощностью 800 ватт, что находится в среднем диапазоне в США. Мы также представили сравнение для контекстуализации выбросов парниковых газов: мили, пройденные на автомобиле с бензиновым двигателем. Для этого мы использовали данные Агентства по охране окружающей среды США, которое оценивает средневзвешенный расход топлива автомобилей в США в 2022 году в 393 грамма эквивалента углекислого газа на милю.Прогнозирование будущего потребления энергии ИИ
После измерения энергопотребления отдельного запроса и выбросов, которые он генерирует, пришло время оценить, как все это складывается в национальный спрос. Существует два способа сделать это. В анализе "снизу вверх" вы оцениваете количество отдельных запросов, рассчитываете энергопотребление каждого из них и суммируете их, чтобы определить общий объем. Для обзора "сверху вниз" вы оцениваете, сколько энергии используют все центры обработки данных, глядя на более крупные тенденции. Анализ "снизу вверх" особенно затруднителен, потому что, опять же, компании с закрытым исходным кодом не делятся такой информацией и отказались обсуждать конкретные детали с нами. Хотя мы можем сделать некоторые обоснованные предположения, чтобы получить представление о том, что может происходить сейчас, для прогнозирования будущего, возможно, лучше использовать подход "сверху вниз". Этих данных тоже не хватает. Самый важный отчет был опубликован в декабре Национальной лабораторией имени Лоуренса Беркли, которая финансируется Министерством энергетики, и авторы отчета отметили, что это всего лишь третий подобный отчет, выпущенный за последние 20 лет.Проблемы с отчетностью
Ученые, занимающиеся исследованиями климата и энергетики, с которыми мы разговаривали, заявили, что серьезной проблемой является то, что ИИ не рассматривается как отдельный экономический сектор для измерений выбросов, и не существует строгих требований к отчетности. В результате трудно отследить климатические последствия ИИ. Тем не менее, мы изучили результаты отчета, сравнили их с другими результатами и оценками, а таАнализ данных и экспертная оценка
Проведены консультации с независимыми экспертами для всестороннего анализа полученных данных. Это позволило получить объективную оценку и подтвердить достоверность представленной информации.
Энергопотребление ИИ: фокус на цифры
Хотя основная часть отчета была посвящена центрам обработки данных в целом, особое внимание было уделено данным, непосредственно связанным с будущим искусственного интеллекта. Цель заключалась в том, чтобы сопоставить эти цифры с заявленными потребностями в энергии, озвученными самими компаниями, разрабатывающими и внедряющими ИИ.
Для этого были изучены отчеты ведущих технологических компаний и фирм, специализирующихся на искусственном интеллекте. Анализировались их планы по расширению энергетической инфраструктуры и центров обработки данных, а также суммы инвестиций, которые они намерены вложить в эти проекты.
Там, где это было возможно, заявления компаний перепроверялись. Например, обещания Meta и Microsoft об увеличении использования атомной энергии действительно приведут к сокращению выбросов углекислого газа, но для ввода в эксплуатацию необходимых атомных электростанций потребуются годы, если не десятилетия.
Информационные запросы к компаниям
Были направлены запросы в Microsoft, Google и OpenAI с целью организации предметных дискуссий на основе данных об энергопотреблении их моделей при использовании ИИ для логических выводов. К сожалению, ни одна из компаний не предоставила своих руководителей или экспертов для официальных интервью по теме энергопотребления.
Глубокое погружение: изменение климата и энергетика
Рассмотрим некоторые важные аспекты, связанные с изменением климата и энергетикой, в контексте развития технологий искусственного интеллекта. Это поможет сформировать более полное представление о проблеме и возможных путях ее решения.
Возвращение забытых технологий
Давно забытая американская ядерная технология возвращается в Китай. Речь идет о ториевом реакторе – идее, которая возрождается после того, как была отложена в середине 20-го века. Этот пример демонстрирует, как старые разработки могут получить новую жизнь в условиях современных вызовов.
Возобновляемая энергия и надежность энергосистемы
Возобновляемая энергия играет все более важную роль в современной энергосистеме. Однако необходимо обеспечить ее надежное функционирование. Важно разрабатывать стратегии и технологии, которые позволят интегрировать возобновляемые источники энергии в существующую инфраструктуру без ущерба для стабильности.
Кондиционирование воздуха: скрытый потребитель энергии
Часто основное внимание уделяется энергопотреблению центров обработки данных, но не стоит забывать о таком крупном потребителе энергии, как системы кондиционирования воздуха. В некоторых регионах затраты на охлаждение помещений могут значительно превышать затраты на работу серверов. Необходимо искать более эффективные и экологичные способы охлаждения.
Ключевые графики: состояние ИИ и энергетики
Рассмотрим несколько графиков, которые помогут оценить текущее состояние развития искусственного интеллекта и его влияние на энергетику. Анализ цифр позволит отбросить лишний шум и сфокусироваться на ключевых тенденциях и проблемах.