Google разработала чип, который революционизирует экономику ИИ
Новый чип Google Ironwood революционизирует AI, снижая огромные затраты на обработку запросов. Фокус смещается с обучения моделей на эффективную работу с миллиардами пользовательских запросов в режиме реального времени. Узнайте, как Google оптимизирует AI для бизнеса.

Чип Ironwood TPU: экономичный подход Google к ИИ
На конференции Google Cloud Next '25 компания представила Ironwood TPU – новый специализированный чип для искусственного интеллекта. В отличие от предшественников, его основное назначение – инференс (обработка запросов миллионов пользователей), а не обучение нейронных сетей. Это решение обусловлено смещением фокуса индустрии ИИ от научных исследований к практическому применению, что влечет за собой значительный рост затрат на вычисления, особенно на этапе инференса. Ironwood отражает стратегический поворот Google к оптимизации стоимости обработки запросов.
Инференс: массовый рынок вычислительных мощностей
Google разрабатывает чипы TPU более десяти лет. Однако рынок чипов для инференса значительно превосходит рынок чипов для обучения моделей. Обучение крупных моделей генеративного ИИ требуется относительно редко (примерно раз в год), в то время как инференс необходим ежедневно миллионам пользователей. Поэтому позиционирование Ironwood как преимущественно инференсного чипа – это значимое изменение стратегии компании. Хотя предыдущее поколение TPU (Trillium TPU) поддерживало и обучение, и инференс, Ironwood ориентирован именно на обработку запросов.
Снижение зависимости от сторонних производителей
Этот сдвив в приоритетах может уменьшить зависимость Google от Intel, AMD и Nvidia. Ранее TPU рассматривались как инвестиция в передовые исследования, а не как замена продуктам других производителей. Однако, по данным KeyBanc Capital Markets, доля TPU в облачных вычислениях Google составляет менее 1%, в то время как чипы Intel, AMD и Nvidia – 99%. Эта зависимость оказывает существенное влияние на экономику Google, Microsoft и Amazon. Аналитики Уолл-стрит неоднократно оценивали потенциальный доход Google от продаж TPU, сравнимый с доходом Nvidia. В условиях быстрорастущего рынка ИИ (стоимость которого оценивается в сотни миллиардов долларов), собственные чипы могут помочь Google существенно сократить расходы на инфраструктуру.
Технические характеристики Ironwood TPU: производительность и масштабируемость
Google подчеркивает техническое превосходство Ironwood над Trillium. Ironwood демонстрирует вдвое большую производительность на ватт (29,3 триллиона операций с плавающей запятой в секунду), в шесть раз больше памяти DRAM (192 ГБ HBM) и в 4,5 раза большую пропускную способность памяти (7,2 терабит в секунду). Эти улучшения направлены на минимизацию перемещения данных и задержек при выполнении масштабных вычислений. Акцент на масштабируемости предполагает эффективное использование сотен или тысяч чипов для параллельной обработки задач, что повышает производительность и снижает затраты на ресурсы.
Google отмечает способность Ironwood масштабироваться до сотен тысяч чипов, обеспечивая значительное ускорение вычислений для генеративного ИИ. Объявление о новом чипе сопровождалось презентацией Pathways on Cloud – программного кода для распределения вычислительных задач между различными компьютерами, ранее использовавшегося внутри Google и теперь доступного публично.