今年4月,谷歌推出了第七代TPU“Ironwood”,旨在提升人工智能(AI)应用程序的性能。Google Cloud副总裁Amin Vahdat表示:“Ironwood是谷歌迄今为止功能最强大、性能最强、最节能的TPU,专为大规模支持思考和推理AI模型而设计。”
据Wccftech报道,近日在Hot Chips 2025上,谷歌介绍了第七代TPU“Ironwood”的情况。其配备了192GB的HBM,带宽高达7.4TB/s,单芯片峰值算力达到4614 TFLOPs。相比于2022年推出的TPU v4,“Ironwood”单芯片算力提升了超过16倍,与2023年的TPU v5p相比,也有10倍的升幅。短短数年内,谷歌就将TPU的算力提升了超过一个数量级,这反映了AI模型对计算需求的爆炸性增长,以及自身为满足这一切所做的努力。
谷歌还将“Ironwood”作为Google AI超级计算机架构的核心组件,通过软硬件协同优化,推动生成式AI向更复杂场景演进。在超级计算集群(Superpod)层面,提供了256芯片和9216芯片两种配置选择,后者的AI算力达到了42.5 ExaFLOPS,相比于TPU v4(4096芯片)和TPU v5p(8960芯片)的规模都要更大。
谷歌围绕“Ironwood”构建了一整套机架、网络互连和散热系统,从四颗芯片集成的Ironwood PCBA主板,到16块PCBA主板组成的TPU机架,再到4×4×4 3D环面(3D Torus)网络拓扑,形成一个逻辑计算单元,最后采用芯片间互连技术(ICI),通过混合使用PCB走线、铜缆和光纤链路,将多个机架连接成一个超级计算集群。
一个完整的系统满载状态下功耗超过100kW,谷歌也为其定制了一套高效的水冷散热系统。