logo

От MIPS к эксафлопсам за считанные десятилетия: вычислительная мощь взрывается, и это изменит ИИ

Nvidia представила первый одностоечный сервер с производительностью в один эксафлопс, превзойдя суперкомпьютер Frontier в 73 раза по плотности производительности. Узнайте о революционном прорыве в области вычислений и искусственного интеллекта.

От MIPS к эксафлопсам за считанные десятилетия: вычислительная мощь взрывается, и это изменит ИИ
Nvidia представила первый одностоечный сервер с производительностью в один эксафлопс, превзойдя суперкомпьютер Frontier в 73 раза по плотности производительности. Узнайте о революционном прорыве в области вычислений и искусственного интеллекта.

Сжатие эксафлопа: от Frontier к Blackwell

Компания Nvidia представила первую в мире одностоечную серверную систему, способную выполнять один эксафлоп операций с плавающей запятой (FLOPS) в секунду. Этот прорыв стал возможен благодаря системе GB200 NVL72, использующей новейшие графические процессоры (GPU) Nvidia Blackwell. Стандартный серверный шкаф имеет размеры приблизительно 1,8 м (высота), более 1 м (глубина) и менее 0,6 м (ширина).

Два важных момента

Два аспекта этого достижения заслуживают особого внимания. Во-первых, всего несколько лет назад, в 2022 году, в Национальной лаборатории Ок-Ридж был установлен первый в мире компьютер, способный обрабатывать эксафлоп. Суперкомпьютер «Frontier», разработанный HPE на базе GPU и CPU AMD, состоял из 74 серверных стоек. Новая система Nvidia демонстрирует примерно в 73 раза большую плотность производительности, достигнутую всего за три года. Это эквивалентно утроению производительности ежегодно, что свидетельствует о значительном прогрессе в вычислительной плотности, энергоэффективности и архитектурном проектировании.

Во-вторых, необходимо отметить, что, несмотря на одинаковый показатель в эксафлоп, системы предназначены для решения разных задач: одна оптимизирована для скорости, другая — для точности. Эксафлопная производительность системы Nvidia основана на вычислениях с пониженной точностью — 4-битных и 8-битных операциях с плавающей запятой. Такой подход оптимален для задач ИИ, включая обучение и запуск больших языковых моделей (LLM), где приоритетом является скорость над точностью. В отличие от этого, эксафлопная производительность «Frontier» достигается с использованием 64-битных вычислений с двойной точностью — золотого стандарта для научных симуляций, где точность критически важна.

Мы прошли долгий путь (очень быстро)

Такой стремительный прогресс кажется почти невероятным, особенно если сравнить его с состоянием вычислительной техники нескольких десятилетий назад. В качестве примера можно привести мейнфрейм DEC KL 1090. Эта машина, предлагавшая 1,8 миллиона инструкций в секунду (MIPS), подключалась к электронно-лучевым трубкам (ЭЛТ) через жестко проводные кабели. Графических возможностей не было, только текстовый вывод. Интернета, естественно, тоже не существовало. Удаленные пользователи подключались по телефонным линиям с помощью модемов, работающих со скоростью до 1200 бит в секунду.

В 500 миллиардов раз больше вычислительных мощностей

Хотя сравнение MIPS и FLOPS дает общее представление о прогрессе, следует помнить, что эти показатели измеряют разные вычислительные нагрузки. MIPS отражает скорость обработки целых чисел, важную для универсальных вычислений, особенно в бизнес-приложениях. FLOPS измеряет производительность с плавающей запятой, критическую для научных вычислений и сложных числовых расчетов, лежащих в основе современного ИИ, таких как матричная математика и линейная алгебра. Разница в производительности между современными системами и DEC KL 1090 составляет порядка 500 миллиардов раз, демонстрируя ошеломляющий темп развития вычислительной техники.

для обучения и запуска моделей машинного обучения (ML). Хотя это не прямое сравнение, масштаб разницы между MIPS тогда и FLOPS сейчас демонстрирует быстрый рост вычислительной мощности. Используя эти показатели как приблизительную оценку выполненной работы, новая система Nvidia примерно в 500 миллиардов раз мощнее машины DEC. Такой скачок иллюстрирует экспоненциальный рост вычислительной мощности за одну профессиональную карьеру и вызывает вопрос: если такой прогресс возможен за 40 лет, что может принести следующие 5 лет?

Взгляд в будущее

Nvidia, со своей стороны, предоставила некоторые подсказки. На конференции GTC компания представила дорожную карту, прогнозирующую, что ее следующая полностоечная система на базе архитектуры «Vera Rubin» Ultra обеспечит в 14 раз большую производительность, чем стойка Blackwell Ultra, поставляемая в этом году, достигнув где-то от 14 до 15 эксафлопов в оптимизированных для ИИ задачах в ближайший год-два. Столь же примечательна и эффективность. Достижение такого уровня производительности в одном шкафу означает меньшее физическое пространство на единицу работы, меньше материалов и потенциально меньшее энергопотребление на операцию, хотя абсолютные потребности в энергии этих систем остаются огромными.

Нужно ли ИИ столько вычислительной мощности?

Хотя такие достижения в производительности действительно впечатляют, отрасль ИИ сейчас сталкивается с фундаментальным вопросом: сколько вычислительной мощности действительно необходимо и какой ценой? Гонка за создание масштабных новых центров обработки данных для ИИ обусловлена растущими потребностями эксамасштабных вычислений и все более мощных моделей ИИ. Самая амбициозная инициатива — проект Stargate стоимостью 500 миллиардов долларов, который предполагает создание 20 центров обработки данных по всей территории США, каждый из которых занимает площадь около 46 000 квадратных метров.

Волна новых проектов гипермасштабируемых центров обработки данных (ЦОД) либо уже реализуется, либо находится на стадии планирования по всему миру, поскольку компании и страны стремятся обеспечить наличие инфраструктуры для поддержки будущих вычислительных задач ИИ. Некоторые аналитики теперь опасаются, что мы можем перестроить мощности ЦОД для ИИ. Озабоченность усилилась после выпуска R1, модели рассуждения от китайской компании DeepSeek, которая требует значительно меньше вычислительных мощностей, чем многие её аналоги. Впоследствии Microsoft отменила договоры аренды с несколькими поставщиками ЦОД, вызвав предположения о пересмотре ожиданий компании в отношении будущего спроса на инфраструктуру ИИ. Однако издание The Register предположило, что этот откат может быть больше связан с тем, что некоторые запланированные ЦОД для ИИ не обладают достаточной мощностью для обеспечения потребностей в электроэнергии и охлаждении систем ИИ следующего поколения. Уже сейчас модели ИИ достигают предела возможностей существующей инфраструктуры. MIT Technology Review сообщило, что это может быть причиной трудностей и сбоев работы многих ЦОД в Китае, построенных по спецификациям, которые не являются оптимальными для текущих потребностей, не говоря уже о потребностях ближайших нескольких лет. ИИ для вывода требует больше FLOPS. Модели рассуждения выполняют большую часть своей работы во время выполнения через процесс, известный как вывод. Эти модели обеспечивают работу некоторых самых передовых и ресурсоемких приложений сегодня, включая глубоких исследовательских помощников и новую волну агентных систем ИИ. Хотя DeepSeek-R1 сначала напугал индустрию, заставив думать, что будущий ИИ может потребовать меньше вычислительной мощности, генеральный директор Nvidia Дженсен Хуанг резко опроверг это мнение. Выступая на CNBC, он противопоставил это мнени

Огромный рост потребления вычислительных ресурсов

Разработка ИИ с функциями рассуждения требует значительно больших вычислительных ресурсов, чем модели без этой способности. По оценкам, расходуется в 100 раз больше вычислительной мощности. Дальнейшее развитие ИИ, от моделей рассуждения к автономным агентам, приведёт к ещё более значительному росту потребности в вычислительных ресурсах. Прорывы ожидаются не только в обработке естественного языка или компьютерном зрении, но и в координации агентов ИИ, симуляциях и создании крупномасштабных цифровых двойников. Недавнее финансирование OpenAI в размере 40 миллиардов долларов – крупнейший раунд частного финансирования в сфере технологий – подтверждает этот тренд. Компания планирует использовать эти средства для продвижения исследований в области ИИ, масштабирования своей вычислительной инфраструктуры и предоставления более мощных инструментов пользователям.

Почему такие огромные инвестиции в ИИ?

Причин множество: от конкуренции до вопросов национальной безопасности. Однако ключевым фактором является потенциальная прибыль. Согласно McKinsey, ИИ может увеличить годовую прибыль корпораций на 4,4 триллиона долларов.

Будущее ИИ: неопределённость и потенциал

Предсказать будущее ИИ сложно. Однако информационные системы всегда стремились к абстрагированию сложности, будь то системы управления аварийными службами, системы отчетности или современные системы ИИ, ускоряющие разработку лекарств. ИИ открывает новые возможности для решения задач, ранее недоступных человеку. Темпы развития впечатляют: GPT-4 генерирует высококачественные изображения по текстовому описанию, Google представила передовую модель рассуждения Gemini 2.5 Pro, а Runway создала видеомодель с высокой степенью согласованности персонажей и сцен. Неизвестно, станет ли мощный ИИ прорывом или угрозой, но с увеличением вычислительных мощностей инновации будут развиваться стремительно.

Ответственность и регулирование

Быстрый рост вычислительных мощностей требует параллельного развития дискуссий об ответственности, регулировании и этических аспектах использования ИИ.