Google 发布了 Ironwood,这是其第七代张量处理单元 (TPU),专为推理而设计。这款功能强大的 AI 加速器旨在处理“思维模型”的大量计算需求,例如大型语言模型和专家混合模型。Ironwood 可扩展至多达 9216 个芯片,提供 42.5 Exaflops 的计算能力,使其比世界上最大的超级计算机更强大。




技术参数对比表
| 指标 | Ironwood | TPU v6e (Trillium) | 英伟达 H200 |
|---|---|---|---|
| 计算精度 | FP8 | BF16/INT8 | FP8 |
| 单芯片峰值算力 | 4614 TFLOPS | 980 TFLOPS | 2560 TFLOPS |
| HBM容量 | 192GB | 32GB | 141GB |
| 能效比(TFLOPS/W) | 29.3 | 14.6 | 21.5 |
| 最大集群规模 | 9216芯片 | 4096芯片 | 4096 GPU |
| 典型推理延迟(ms) | 0.8 | 2.1 | 1.5 |
注:数据综合自各来源
Ironwood的发布不仅重新定义了AI推理硬件的性能边界,更通过“芯片-框架-应用”的全栈优化,推动AI从工具型技术向决策型基础设施进化。其影响将随着生成式AI的普及持续释放,重塑从云计算到边缘计算的整个计算生态。
全部0条评论
快来发表一下你的评论吧 !