От MIPS к эксафлопсам за считанные десятилетия: вычислительная мощь взрывается, и это изменит ИИ
Nvidia представила первый одностоечный сервер с производительностью в один эксафлопс, превзойдя суперкомпьютер Frontier в 73 раза по плотности производительности. Узнайте о революционном прорыве в области вычислений и искусственного интеллекта.

Сжатие эксафлопа: от Frontier к Blackwell
Компания Nvidia представила первую в мире одностоечную серверную систему, способную выполнять один эксафлоп операций с плавающей запятой (FLOPS) в секунду. Этот прорыв стал возможен благодаря системе GB200 NVL72, использующей новейшие графические процессоры (GPU) Nvidia Blackwell. Стандартный серверный шкаф имеет размеры приблизительно 1,8 м (высота), более 1 м (глубина) и менее 0,6 м (ширина).
Два важных момента
Два аспекта этого достижения заслуживают особого внимания. Во-первых, всего несколько лет назад, в 2022 году, в Национальной лаборатории Ок-Ридж был установлен первый в мире компьютер, способный обрабатывать эксафлоп. Суперкомпьютер «Frontier», разработанный HPE на базе GPU и CPU AMD, состоял из 74 серверных стоек. Новая система Nvidia демонстрирует примерно в 73 раза большую плотность производительности, достигнутую всего за три года. Это эквивалентно утроению производительности ежегодно, что свидетельствует о значительном прогрессе в вычислительной плотности, энергоэффективности и архитектурном проектировании.
Во-вторых, необходимо отметить, что, несмотря на одинаковый показатель в эксафлоп, системы предназначены для решения разных задач: одна оптимизирована для скорости, другая — для точности. Эксафлопная производительность системы Nvidia основана на вычислениях с пониженной точностью — 4-битных и 8-битных операциях с плавающей запятой. Такой подход оптимален для задач ИИ, включая обучение и запуск больших языковых моделей (LLM), где приоритетом является скорость над точностью. В отличие от этого, эксафлопная производительность «Frontier» достигается с использованием 64-битных вычислений с двойной точностью — золотого стандарта для научных симуляций, где точность критически важна.
Мы прошли долгий путь (очень быстро)
Такой стремительный прогресс кажется почти невероятным, особенно если сравнить его с состоянием вычислительной техники нескольких десятилетий назад. В качестве примера можно привести мейнфрейм DEC KL 1090. Эта машина, предлагавшая 1,8 миллиона инструкций в секунду (MIPS), подключалась к электронно-лучевым трубкам (ЭЛТ) через жестко проводные кабели. Графических возможностей не было, только текстовый вывод. Интернета, естественно, тоже не существовало. Удаленные пользователи подключались по телефонным линиям с помощью модемов, работающих со скоростью до 1200 бит в секунду.
В 500 миллиардов раз больше вычислительных мощностей
Хотя сравнение MIPS и FLOPS дает общее представление о прогрессе, следует помнить, что эти показатели измеряют разные вычислительные нагрузки. MIPS отражает скорость обработки целых чисел, важную для универсальных вычислений, особенно в бизнес-приложениях. FLOPS измеряет производительность с плавающей запятой, критическую для научных вычислений и сложных числовых расчетов, лежащих в основе современного ИИ, таких как матричная математика и линейная алгебра. Разница в производительности между современными системами и DEC KL 1090 составляет порядка 500 миллиардов раз, демонстрируя ошеломляющий темп развития вычислительной техники.
Взгляд в будущее
Nvidia, со своей стороны, предоставила некоторые подсказки. На конференции GTC компания представила дорожную карту, прогнозирующую, что ее следующая полностоечная система на базе архитектуры «Vera Rubin» Ultra обеспечит в 14 раз большую производительность, чем стойка Blackwell Ultra, поставляемая в этом году, достигнув где-то от 14 до 15 эксафлопов в оптимизированных для ИИ задачах в ближайший год-два. Столь же примечательна и эффективность. Достижение такого уровня производительности в одном шкафу означает меньшее физическое пространство на единицу работы, меньше материалов и потенциально меньшее энергопотребление на операцию, хотя абсолютные потребности в энергии этих систем остаются огромными.
Нужно ли ИИ столько вычислительной мощности?
Хотя такие достижения в производительности действительно впечатляют, отрасль ИИ сейчас сталкивается с фундаментальным вопросом: сколько вычислительной мощности действительно необходимо и какой ценой? Гонка за создание масштабных новых центров обработки данных для ИИ обусловлена растущими потребностями эксамасштабных вычислений и все более мощных моделей ИИ. Самая амбициозная инициатива — проект Stargate стоимостью 500 миллиардов долларов, который предполагает создание 20 центров обработки данных по всей территории США, каждый из которых занимает площадь около 46 000 квадратных метров.