logo

Новый чип Google: в 24 раза мощнее самых быстрых суперкомпьютеров мира

Google представил Ironwood — новый TPU 7-го поколения, в 24 раза мощнее самого быстрого суперкомпьютера. Этот чип, разработанный специально для вывода AI-моделей, знаменует новую эру в развитии генеративного ИИ. Узнайте о его невероятной производительности и возможностях.

Новый чип Google: в 24 раза мощнее самых быстрых суперкомпьютеров мира
Google представил Ironwood — новый TPU 7-го поколения, в 24 раза мощнее самого быстрого суперкомпьютера. Этот чип, разработанный специально для вывода AI-моделей, знаменует новую эру в развитии генеративного ИИ. Узнайте о его невероятной производительности и возможностях.

Презентация Google Cloud TPU Ironwood: новый стандарт вычислений для ИИ

Компания Google Cloud представила процессор седьмого поколения Tensor Processing Unit (TPU), получивший название Ironwood. Он обеспечивает более чем в 24 раза большую вычислительную мощность, чем самый быстрый суперкомпьютер в мире при масштабировании. Анонсированный на Google Cloud Next '25, чип знаменует собой существенный этап в десятилетней стратегии Google по разработке специализированных процессоров для ИИ. В отличие от предыдущих поколений TPU, предназначенных как для обучения, так и для вывода, Ironwood — первый чип, созданный специально для вывода – процесса применения обученных моделей ИИ для прогнозирования или генерации ответов. Амин Вахдат, вице-президент и генеральный менеджер Google по машинному обучению, системам и облачному ИИ, подчеркнул, что Ironwood призван поддержать развитие генеративного ИИ и его высоких вычислительных и коммуникационных требований. Это новая «эра вывода», где агенты ИИ будут активно извлекать и генерировать данные для совместной доставки информации и ответов, а не просто данных.

Прорывные вычислительные возможности: 42,5 эксафлопса Ironwood

Технические характеристики Ironwood впечатляют. При масштабировании до 9216 чипов в одном модуле, он обеспечивает 42,5 эксафлопса вычислительной мощности, значительно превосходя 1,7 эксафлопса El Capitan, самого быстрого суперкомпьютера на сегодняшний день. Каждый чип Ironwood обеспечивает пиковую производительность 4614 терафлопс. Кроме того, наблюдаются значительные улучшения памяти и пропускной способности. Каждый чип оснащен 192 ГБ высокопроизводительной памяти (HBM), что в шесть раз больше, чем у Trillium, TPU предыдущего поколения. Пропускная способность памяти достигает 7,2 терабит в секунду на чип, что в 4,5 раза лучше, чем у Trillium. Важно отметить, что Ironwood обеспечивает вдвое большую производительность на ватт по сравнению с Trillium и почти в 30 раз энергоэффективнее, чем первый Cloud TPU Google 2018 года. В условиях ограниченных ресурсов дата-центров, это обеспечивает значительно большую производительность на ватт для рабочих нагрузок клиентов.

От построения моделей к «мыслящим машинам»: фокус Google на выводе

Акцент на выводе, а не на обучении, знаменует важную веху в развитии ИИ. Долгое время отрасль фокусировалась на создании масштабных базовых моделей, конкурируя в основном по размеру параметров и возможностям обучения. Переход Google к оптимизации вывода свидетельствует о переходе к новой фазе, где эффективность развертывания и возможности рассуждения выходят на первый план. Это логичный шаг, поскольку обучение происходит один раз, а операции вывода выполняются миллиарды раз в день при взаимодействии пользователей с системами ИИ. Экономика ИИ все больше зависит от стоимости вывода, особенно с усложнением и ростом вычислительной интенсивности моделей. Google отмечает десятикратное увеличение спроса на вычислительные мощности для вывода.

Энергоэффективность и масштабируемость Ironwood

Ironwood демонстрирует впечатляющий баланс между производительностью и энергоэффективностью. Значительное улучшение производительности на ватт позволяет снизить операционные затраты и углеродный след, что особенно важно для крупных ИИ-систем. Масштабируемость Ironwood, достигаемая за счет использования множества чипов, позволяет обрабатывать огромные объемы данных, необходимые для современных генеративных моделей ИИ. Это открывает новые возможности для разработки и развертывания сложных ИИ-приложений, требующих высокой производительности и низкого энергопотребления.

Заключение

Google Cloud TPU Ironwood представляет собой значительный прорыв в области вычислений для ИИ. Его фокус на выводе, высокая производительность и энергоэффективность открывают новые горизонты для развития генеративного ИИ и других вычислительно-емких задач. Это демонстрирует стремление Google к созданию более эффективных и доступных ИИ-решений для широкого круга пользователей.

проса на вычислительные мощности ИИ год от года за последние восемь лет — ошеломляющий фактор в 100 миллионов в целом. Никакое развитие по закону Мура не могло бы удовлетворить эту кривую роста без специализированных архитектур, таких как Ironwood. Особенно примечателен акцент на «мыслящих моделях», которые выполняют сложные задачи рассуждения, а не простое распознавание образов. Это говорит о том, что Google видит будущее ИИ не только в больших моделях, но и в моделях, которые могут разбивать задачи на подзадачи, рассуждать в несколько этапов и, по сути, моделировать процессы человеческого мышления.

Двигатель мышления Gemini: как модели следующего поколения Google используют передовое оборудование

Google позиционирует Ironwood как основу для своих самых передовых моделей ИИ, включая Gemini 2.5, которые, по словам компании, имеют «встроенные возможности мышления». На конференции Google также анонсировала Gemini 2.5 Flash, более экономичную версию своей флагманской модели, которая «регулирует глубину рассуждений в зависимости от сложности запроса». В то время как Gemini 2.5 Pro предназначена для сложных случаев использования, таких как открытие лекарств и финансовое моделирование, Gemini 2.5 Flash предназначена для повседневных приложений, где важна скорость отклика. Компания также продемонстрировала свой полный набор моделей генеративных медиа, включая текст-в-изображение, текст-в-видео и недавно анонсированную возможность текст-в-музыку под названием Lyria. Демонстрация показала, как эти инструменты можно использовать вместе для создания полного рекламных видеороликов для концерта.

За пределами кремния: всеобъемлющая инфраструктурная стратегия Google включает сеть и программное обеспечение

Ironwood — лишь одна часть более широкой стратегии Google в области инфраструктуры ИИ.

Компания также анонсировала Cloud WAN, управляемую услугу глобальной сети, предоставляющую предприятиям доступ к глобальной частной сетевой инфраструктуре Google. «Cloud WAN — это полностью управляемый, жизнеспособный и безопасный основной каркас корпоративной сети, который обеспечивает до 40% улучшение производительности сети, одновременно снижая общую стоимость владения на те же 40%», — сказал Вахдат. Google также расширяет свои программные предложения для рабочих нагрузок ИИ, включая Pathways, свой механизм выполнения машинного обучения, разработанный Google DeepMind. Pathways на Google Cloud позволяет клиентам масштабировать обслуживание моделей на сотнях TPU. Эти анонсы аппаратного и программного обеспечения приходятся на решающий момент для Google Cloud, который, согласно последнему отчету о прибылях и убытках, получил выручку в размере 12 миллиардов долларов в четвертом квартале 2024 года, что на 30% больше по сравнению с прошлым годом. Экономика развертывания ИИ всё чаще становится фактором дифференциации в «облачных войнах». Google сталкивается с жесткой конкуренцией со стороны Microsoft Azure, которая использовала своё партнёрство с OpenAI для достижения внушительных рыночных позиций, и Amazon Web Services, которая продолжает расширять свои предложения чипов Trainium и Inferentia. Отличие подхода Google заключается в его вертикальной интеграции. В то время как конкуренты сотрудничают с производителями чипов или приобретают стартапы, Google разрабатывает TPU собственными силами уже более десяти лет. Это обеспечивает компании беспрецедентный контроль над своим стеком ИИ, от кремния до программного обеспечения и услуг. Предоставляя эту технологию корпоративным клиентам, Google делает ставку на то, что его многолетний опыт создания чипов для поиска, Gmail и YouTube принесёт конкурентные преимущества на корпоративном рынке. Стратегия ясна: предлагать ту же инфраструктуру, которая обеспечивает работу собственного ИИ Google, в масштабе, любому, кто готов за это платить. Помимо аппаратного обеспечения, Google изложил видение ИИ, ориентированное на многоагентные системы. Компания анонсировала Agent Development Kit (ADK), который позволяет разработчикам создавать системы, где могут взаимодействовать несколько агентов ИИ. Пожалуй, наиболее значимым стало объявление «протокола взаимодействия агент-агент» (A2A), который позволяет агентам ИИ, созданным на разных платформах и разными поставщиками, общаться друг с другом. «2025 год станет переходным годом, когда генеративный ИИ перейдёт от ответа на отдельные вопросы к решению сложных задач с помощью агентных систем», — предсказал Вахдат. Google сотрудничает с более чем 50 лидер

Экономия ресурсов и стандартизация в сфере ИИ: инициативы Google

Объявления Google о новых технологиях, таких как Ironwood и протокол взаимодействия агентов, обещают значительное снижение затрат и упрощение работы со сложными моделями искусственного интеллекта для предприятий.

Повышенная эффективность и снижение зависимости от поставщиков

Повышенная эффективность Ironwood делает запуск передовых моделей рассуждений более экономичным. Одновременно, протокол взаимодействия агентов помогает компаниям избежать привязки к конкретному поставщику ИИ. Это особенно важно, учитывая, что многие организации откладывали внедрение передовых моделей из-за высоких затрат на инфраструктуру и энергопотребление. Успех инициативы Google может стимулировать новую волну внедрения ИИ в тех отраслях, где он до сих пор использовался ограниченно.

Многоагентный подход также решает проблему сложности развертывания ИИ в разных системах и у разных поставщиков. Стандартизация взаимодействия ИИ-систем призвана преодолеть разрозненность, которая до сих пор сдерживала широкое применение ИИ в бизнесе. Google анонсировал более 400 кейсов успешного применения своих ИИ-инноваций.

Инвестиции в инфраструктуру и стратегическое позиционирование

По мере развития ИИ, инфраструктура становится все более важной. Инвестиции Google в специализированное оборудование, такое как Ironwood, в сочетании с разработкой стандартов взаимодействия агентов, указывают на стратегическое видение будущего, где ИИ будет более распределенным, сложным и тесно интегрированным в бизнес-процессы. Как подчеркнул Вахдат, ведущие модели, такие как Gemini 2.5 и AlphaFold, уже работают на TPU, а с выходом Ironwood в конце года ожидаются новые прорывы в области ИИ.

Стратегические последствия и конкурентная борьба

Стратегия Google представляет собой сложный баланс: продвижение открытых стандартов взаимодействия агентов при одновременном сохранении конкурентного преимущества в области аппаратного обеспечения. Компания стремится к развитию всей экосистемы на базе своей инфраструктуры, сохраняя при этом собственную лидирующую позицию. Реакция конкурентов, таких как Microsoft и Amazon, на достижения Google в области аппаратного обеспечения и стандартизации взаимодействия агентов, станет важным фактором в ближайшем будущем. Вероятна конкурентная гонка за создание наиболее эффективной инфраструктуры ИИ.