Новый чип Google: в 24 раза мощнее самых быстрых суперкомпьютеров мира
Google представил Ironwood — новый TPU 7-го поколения, в 24 раза мощнее самого быстрого суперкомпьютера. Этот чип, разработанный специально для вывода AI-моделей, знаменует новую эру в развитии генеративного ИИ. Узнайте о его невероятной производительности и возможностях.

Презентация Google Cloud TPU Ironwood: новый стандарт вычислений для ИИ
Компания Google Cloud представила процессор седьмого поколения Tensor Processing Unit (TPU), получивший название Ironwood. Он обеспечивает более чем в 24 раза большую вычислительную мощность, чем самый быстрый суперкомпьютер в мире при масштабировании. Анонсированный на Google Cloud Next '25, чип знаменует собой существенный этап в десятилетней стратегии Google по разработке специализированных процессоров для ИИ. В отличие от предыдущих поколений TPU, предназначенных как для обучения, так и для вывода, Ironwood — первый чип, созданный специально для вывода – процесса применения обученных моделей ИИ для прогнозирования или генерации ответов. Амин Вахдат, вице-президент и генеральный менеджер Google по машинному обучению, системам и облачному ИИ, подчеркнул, что Ironwood призван поддержать развитие генеративного ИИ и его высоких вычислительных и коммуникационных требований. Это новая «эра вывода», где агенты ИИ будут активно извлекать и генерировать данные для совместной доставки информации и ответов, а не просто данных.
Прорывные вычислительные возможности: 42,5 эксафлопса Ironwood
Технические характеристики Ironwood впечатляют. При масштабировании до 9216 чипов в одном модуле, он обеспечивает 42,5 эксафлопса вычислительной мощности, значительно превосходя 1,7 эксафлопса El Capitan, самого быстрого суперкомпьютера на сегодняшний день. Каждый чип Ironwood обеспечивает пиковую производительность 4614 терафлопс. Кроме того, наблюдаются значительные улучшения памяти и пропускной способности. Каждый чип оснащен 192 ГБ высокопроизводительной памяти (HBM), что в шесть раз больше, чем у Trillium, TPU предыдущего поколения. Пропускная способность памяти достигает 7,2 терабит в секунду на чип, что в 4,5 раза лучше, чем у Trillium. Важно отметить, что Ironwood обеспечивает вдвое большую производительность на ватт по сравнению с Trillium и почти в 30 раз энергоэффективнее, чем первый Cloud TPU Google 2018 года. В условиях ограниченных ресурсов дата-центров, это обеспечивает значительно большую производительность на ватт для рабочих нагрузок клиентов.
От построения моделей к «мыслящим машинам»: фокус Google на выводе
Акцент на выводе, а не на обучении, знаменует важную веху в развитии ИИ. Долгое время отрасль фокусировалась на создании масштабных базовых моделей, конкурируя в основном по размеру параметров и возможностям обучения. Переход Google к оптимизации вывода свидетельствует о переходе к новой фазе, где эффективность развертывания и возможности рассуждения выходят на первый план. Это логичный шаг, поскольку обучение происходит один раз, а операции вывода выполняются миллиарды раз в день при взаимодействии пользователей с системами ИИ. Экономика ИИ все больше зависит от стоимости вывода, особенно с усложнением и ростом вычислительной интенсивности моделей. Google отмечает десятикратное увеличение спроса на вычислительные мощности для вывода.
Энергоэффективность и масштабируемость Ironwood
Ironwood демонстрирует впечатляющий баланс между производительностью и энергоэффективностью. Значительное улучшение производительности на ватт позволяет снизить операционные затраты и углеродный след, что особенно важно для крупных ИИ-систем. Масштабируемость Ironwood, достигаемая за счет использования множества чипов, позволяет обрабатывать огромные объемы данных, необходимые для современных генеративных моделей ИИ. Это открывает новые возможности для разработки и развертывания сложных ИИ-приложений, требующих высокой производительности и низкого энергопотребления.
Заключение
Google Cloud TPU Ironwood представляет собой значительный прорыв в области вычислений для ИИ. Его фокус на выводе, высокая производительность и энергоэффективность открывают новые горизонты для развития генеративного ИИ и других вычислительно-емких задач. Это демонстрирует стремление Google к созданию более эффективных и доступных ИИ-решений для широкого круга пользователей.
проса на вычислительные мощности ИИ год от года за последние восемь лет — ошеломляющий фактор в 100 миллионов в целом. Никакое развитие по закону Мура не могло бы удовлетворить эту кривую роста без специализированных архитектур, таких как Ironwood. Особенно примечателен акцент на «мыслящих моделях», которые выполняют сложные задачи рассуждения, а не простое распознавание образов. Это говорит о том, что Google видит будущее ИИ не только в больших моделях, но и в моделях, которые могут разбивать задачи на подзадачи, рассуждать в несколько этапов и, по сути, моделировать процессы человеческого мышления.Двигатель мышления Gemini: как модели следующего поколения Google используют передовое оборудование
Google позиционирует Ironwood как основу для своих самых передовых моделей ИИ, включая Gemini 2.5, которые, по словам компании, имеют «встроенные возможности мышления». На конференции Google также анонсировала Gemini 2.5 Flash, более экономичную версию своей флагманской модели, которая «регулирует глубину рассуждений в зависимости от сложности запроса». В то время как Gemini 2.5 Pro предназначена для сложных случаев использования, таких как открытие лекарств и финансовое моделирование, Gemini 2.5 Flash предназначена для повседневных приложений, где важна скорость отклика. Компания также продемонстрировала свой полный набор моделей генеративных медиа, включая текст-в-изображение, текст-в-видео и недавно анонсированную возможность текст-в-музыку под названием Lyria. Демонстрация показала, как эти инструменты можно использовать вместе для создания полного рекламных видеороликов для концерта.
За пределами кремния: всеобъемлющая инфраструктурная стратегия Google включает сеть и программное обеспечение
Ironwood — лишь одна часть более широкой стратегии Google в области инфраструктуры ИИ.
Экономия ресурсов и стандартизация в сфере ИИ: инициативы Google
Объявления Google о новых технологиях, таких как Ironwood и протокол взаимодействия агентов, обещают значительное снижение затрат и упрощение работы со сложными моделями искусственного интеллекта для предприятий.
Повышенная эффективность и снижение зависимости от поставщиков
Повышенная эффективность Ironwood делает запуск передовых моделей рассуждений более экономичным. Одновременно, протокол взаимодействия агентов помогает компаниям избежать привязки к конкретному поставщику ИИ. Это особенно важно, учитывая, что многие организации откладывали внедрение передовых моделей из-за высоких затрат на инфраструктуру и энергопотребление. Успех инициативы Google может стимулировать новую волну внедрения ИИ в тех отраслях, где он до сих пор использовался ограниченно.
Многоагентный подход также решает проблему сложности развертывания ИИ в разных системах и у разных поставщиков. Стандартизация взаимодействия ИИ-систем призвана преодолеть разрозненность, которая до сих пор сдерживала широкое применение ИИ в бизнесе. Google анонсировал более 400 кейсов успешного применения своих ИИ-инноваций.
Инвестиции в инфраструктуру и стратегическое позиционирование
По мере развития ИИ, инфраструктура становится все более важной. Инвестиции Google в специализированное оборудование, такое как Ironwood, в сочетании с разработкой стандартов взаимодействия агентов, указывают на стратегическое видение будущего, где ИИ будет более распределенным, сложным и тесно интегрированным в бизнес-процессы. Как подчеркнул Вахдат, ведущие модели, такие как Gemini 2.5 и AlphaFold, уже работают на TPU, а с выходом Ironwood в конце года ожидаются новые прорывы в области ИИ.
Стратегические последствия и конкурентная борьба
Стратегия Google представляет собой сложный баланс: продвижение открытых стандартов взаимодействия агентов при одновременном сохранении конкурентного преимущества в области аппаратного обеспечения. Компания стремится к развитию всей экосистемы на базе своей инфраструктуры, сохраняя при этом собственную лидирующую позицию. Реакция конкурентов, таких как Microsoft и Amazon, на достижения Google в области аппаратного обеспечения и стандартизации взаимодействия агентов, станет важным фактором в ближайшем будущем. Вероятна конкурентная гонка за создание наиболее эффективной инфраструктуры ИИ.