Neuropolis

ИИ от Google DeepMind решает реальные задачи лучше людей

Новый AI от Google DeepMind, AlphaEvolve, превосходит людей в решении реальных задач, используя LLM для оптимизации алгоритмов управления данными, проектирования чипов и многого другого.

7 минут

AlphaEvolve: Новый этап в развитии ИИ от Google DeepMind

Google DeepMind представила AlphaEvolve, ИИ-агента, демонстрирующего выдающиеся результаты в решении сложных задач. Он способен находить новые алгоритмы, превосходящие решения, разработанные человеком, в таких областях, как управление центрами обработки данных и проектирование чипов. AlphaEvolve использует большие языковые модели, чтобы выйти за рамки традиционных подходов и предложить инновационные решения.

В Google DeepMind продолжают активно использовать возможности больших языковых моделей для поиска ответов на сложные вопросы в математике и информатике. Новый подход оказался эффективным не только в решении теоретических головоломок, но и в оптимизации важных реальных процессов.

Архитектура и возможности AlphaEvolve

В основе AlphaEvolve лежит семейство больших языковых моделей Gemini 2.0, которое используется для создания кода для различных задач. Хотя большие языковые модели не всегда идеально справляются с кодированием, AlphaEvolve оценивает каждое предложение Gemini, отсеивая неудачные варианты и дорабатывая перспективные, в итеративном процессе. В результате получается оптимальный алгоритм.

Зачастую, алгоритмы, созданные AlphaEvolve, оказываются более эффективными и точными, чем существующие решения, разработанные людьми. Pushmeet Kohli, вице-президент Google DeepMind, характеризует AlphaEvolve как "суперкодировщика", способного предлагать решения, которые ранее оставались незамеченными.

Примеры практического применения

Одним из примеров успешного применения AlphaEvolve является разработка усовершенствованного программного обеспечения для распределения задач между серверами Google. Этот процесс имеет решающее значение для эффективной работы глобальной инфраструктуры Google.

Другой пример – оптимизация программного обеспечения, используемого Google для распределения задач между миллионами серверов по всему миру. Это демонстрирует потенциал AlphaEvolve в улучшении ключевых процессов внутри компании.

Влияние на ресурсы и перспективы

По данным Google DeepMind, новое программное обеспечение, разработанное с помощью AlphaEvolve, уже более года используется во всех центрах обработки данных Google. Это позволило высвободить 0,7% от общего объема вычислительных ресурсов компании, что является значительным показателем в масштабах Google.

Якоб Моосбауэр, математик из Университета Уорика, высоко оценил способность AlphaEvolve находить алгоритмы, генерирующие конкретные решения, а не просто предлагать сами решения. Это делает подход AlphaEvolve универсальным и применимым к широкому кругу задач. Он подчеркнул, что ИИ становится незаменимым инструментом в математике и информатике, открывая новые горизонты для исследований и разработок.

Эволюция разработок DeepMind: От AlphaTensor к AlphaEvolve

AlphaEvolve продолжает линию разработок Google DeepMind, направленных на расширение человеческих знаний в математике и науке с помощью ИИ. В 2022 году был представлен AlphaTensor, модель, нашедшая более быстрый способ умножения матриц, фундаментальной задачи в информатике, побив рекорд, державшийся более 50 лет. В 2023 году появился AlphaDev, который обнаружил более быстрые способы выполнения базовых вычислений, используемых компьютерами триллионы раз в день.

AlphaTensor и AlphaDev преобразуют математические задачи в подобие игры, в которой ИИ ищет выигрышную стратегию. FunSearch, представленный в конце 2023 года, заменил ИИ для игр на LLM, способные генерировать код. Благодаря своей универсальности, FunSearch может решать более широкий спектр задач, чем его предшественники, обученные только одному типу игр.

AlphaEvolve представляет собой следующее поколение FunSearch. Вместо создания коротких фрагментов кода для решения конкретной задачи, AlphaEvolve разрабатывает полноценные алгоритмы, способные решать широкий круг задач.

проблемы, как это делал FunSearch, он может создавать программы, состоящие из сотен строк.

Широкий спектр применения

Теоретически, AlphaEvolve может быть применен к любой проблеме, которая может быть описана в коде и решения которой могут быть оценены компьютером. "Алгоритмы управляют миром вокруг нас, поэтому влияние этого огромно", - говорит Matej Balog, исследователь из Google DeepMind, возглавляющий команду по обнаружению алгоритмов.

Как работает AlphaEvolve: Выживает сильнейший

AlphaEvolve можно использовать как и любую другую LLM. Ему дают описание проблемы и любые дополнительные подсказки, такие как предыдущие решения, и AlphaEvolve задействует Gemini 2.0 Flash (самую маленькую и быструю версию флагманской LLM Google DeepMind) для создания нескольких блоков кода для решения проблемы.

Затем он берет эти решения-кандидаты, запускает их, чтобы увидеть, насколько они точны или эффективны, и оценивает их по ряду соответствующих показателей. Например, выдает ли этот код правильный результат? Работает ли он быстрее предыдущих решений?

Затем AlphaEvolve берет лучшие из текущей партии решений и просит Gemini улучшить их.

Иногда AlphaEvolve возвращает предыдущее решение в пул, чтобы Gemini не зашел в тупик. Когда он застревает, AlphaEvolve может также обратиться к Gemini 2.0 Pro, самой мощной из LLM Google DeepMind. Идея состоит в том, чтобы генерировать много решений с помощью более быстрого Flash, но добавлять решения от более медленного Pro, когда это необходимо.

Эти раунды генерации, оценки и регенерации продолжаются до тех пор, пока Gemini не сможет предложить ничего лучше, чем то, что у него уже есть.

Команда по числовым играм

Числовые игры Команда протестировала AlphaEvolve на ряде различных задач. Например, они снова рассмотрели умножение матриц, чтобы увидеть, как универсальный инструмент, такой как AlphaEvolve, соотносится со специализированным AlphaTensor. Матрицы — это сетки чисел. Умножение матриц — это базовая вычислительная операция, лежащая в основе многих приложений, от искусственного интеллекта до компьютерной графики, однако никто не знает, как это сделать быстрее всего. "Трудно поверить, что это все еще открытый вопрос", — говорит Балог. Команда предоставила AlphaEvolve описание проблемы и пример стандартного алгоритма для ее решения. Инструмент не только создал новые алгоритмы, которые могли вычислять 14 различных размеров матриц быстрее, чем любой существующий подход, но и улучшил рекордный результат AlphaTensor для умножения двух матриц четыре на четыре. AlphaEvolve оценил 16 000 кандидатов, предложенных Gemini, чтобы найти выигрышное решение, но это все равно эффективнее, чем AlphaTensor, говорит Балог. Решение AlphaTensor также работало только тогда, когда матрица была заполнена 0 и 1. AlphaEvolve решает проблему и с другими числами.

Реальные задачи и ограничения

"Результат по умножению матриц очень впечатляет", — говорит Моосбауэр. "Этот новый алгоритм может ускорить вычисления на практике". Мануэль Кауэрс, математик из Университета Иоганна Кеплера в Линце, Австрия, согласен: "Улучшение для матриц, вероятно, будет иметь практическое значение". По совпадению, Кауэрс и его коллега только что использовали другую вычислительную технику, чтобы найти некоторые из ускорений, которые AlphaEvolve придумал. Пара разместила статью в интернете, сообщающую об их результатах на прошлой неделе. "Замечательно видеть, что мы продвигаемся вперед в понимании умножения матриц", — говорит Кауэрс. "Каждая техника, которая помогает, является желанным вкладом в эти усилия". Реальные задачи Умножение матриц было лишь одним прорывом. В общей сложности Google DeepMind протестировала AlphaEvolve на более чем 50 различных типах известных математических задач, включая задачи в области анализа Фурье (математика, лежащая в основе сжатия данных, необходимого для таких приложений, как потоковое видео), задачу минимального перекрытия (открытая проблема в теории чисел, предложенная математиком Полом Эрдёшем в 1955 году) и числа поцелуев (проблема, введенная Исааком Ньютоном, которая имеет применение в материаловедении, химии и криптографии). AlphaEvolve соответствовал лучшим существующим решениям в 75% случаев и находил лучшие решения в 20% случаев. Затем Google DeepMind применила AlphaEvolve к нескольким реальным задачам. Помимо разработки более эффективного алгоритма управления вычислительными ресурсами в центрах обработки данных, инструмент нашел способ снизить энергопотребление специализированных чипов Tensor Processing Unit от Google. AlphaEvolve даже нашел способ ускорить обучение самого Gemini, разработав более эффективный алгоритм управления определенным типом вычислений, используемым в процессе об

Ограничения и перспективы AlphaEvolve

Одним из ключевых ограничений AlphaEvolve является его неприменимость к задачам, требующим субъективной оценки человека. Например, инструмент не подходит для анализа лабораторных экспериментов, результаты которых требуют интерпретации исследователем.

Несмотря на способность AlphaEvolve достигать впечатляющих результатов в различных областях, он не предоставляет глубокого теоретического понимания механизмов, лежащих в основе этих решений. Это становится препятствием для расширения научного знания и понимания. Тем не менее, подобные инструменты, как AlphaEvolve, способны кардинально изменить подходы к исследовательской работе.

По словам Кохли, потенциал для дальнейшего развития этого подхода остается значительным. Это говорит о том, что AlphaEvolve — лишь первый шаг в эволюции подобных инструментов, и в будущем можно ожидать появления еще более мощных и эффективных решений.

Влияние ИИ на различные сферы

Растущее влияние искусственного интеллекта (ИИ) на различные сферы жизни привлекает все больше внимания. OpenAI провела исследование, посвященное влиянию ChatGPT на эмоциональное благополучие пользователей. Результаты этой работы позволяют лучше понять, как чат-боты влияют на наше состояние, но многие вопросы все еще остаются без ответа.

Одновременно с развитием позитивных аспектов ИИ, возрастают и риски, связанные с его использованием в злонамеренных целях. Эксперты предупреждают о скором появлении кибератак, осуществляемых с помощью ИИ-агентов. Эти агенты способны значительно упростить и удешевить взлом систем в больших масштабах, что представляет серьезную угрозу для кибербезопасности.

Китай активно инвестирует в развитие инфраструктуры ИИ, строя сотни центров обработки данных. Однако, по мнению аналитиков, «золотая лихорадка» вокруг этих центров начинает спадать из-за спекулятивных инвестиций и слабого спроса. Это говорит о необходимости более взвешенного и стратегического подхода к развитию ИИ-инфраструктуры.

Источник:www.technologyreview.com