Google发布第八代TPU:训练性能3倍跃升,推理SRAM暴增3倍,锁定AI算力新拐点
内容摘要
核心要点
Google Cloud Next 2026上,CEO Sundar Pichai宣布了第八代TPU,采用双芯片策略:TPU 8t专注于训练,单个超级Pod可扩展至9600个TPU,配备2PB共享高带宽内存,训练处理能力是上一代Ironwood的3倍,每瓦性能提升2倍。TPU 8i针对推理优化,单Pod连接1152个TPU,片上SRAM增加3倍,可并发运行数百万AI智能体。
此外,Google推出了Gemini Enterprise Agent Platform,提供构建、扩展、治理和优化企业智能体的全栈解决方案,并整合了基于Threat Intelligence和Wiz的AI驱动网络安全,以及Wiz AI Application Protection Platform。Google内部75%的新代码由AI生成并经工程师批准。
在通用计算方面,N4 Axion实例基于ARM架构,相比同代x86实例提供2倍更好的性价比。Agentic Data Cloud帮助企业数据被AI智能体快速读取和利用。
重要性说明
Google此次发布表面是硬件升级,实则是在防守NVIDIA在AI训练领域的统治地位,并合围AWS和Azure的自研芯片阵营。TPU 8t的3倍性能提升直接瞄准NVIDIA的B200/GB200,而TPU 8i的SRAM暴增则针对推理场景中的内存带宽瓶颈,意图将用户从NVIDIA GPU生态(CUDA、TensorRT)迁移到Google的TPU+JAX/TensorFlow栈。
更隐蔽的锁定在于Gemini Enterprise Agent Platform和Agentic Data Cloud。Google通过全栈代理平台,将企业AI应用从模型层绑定到Google Cloud的治理、安全、数据管道,剥夺了用户使用多模型(如Llama、Claude)的架构弹性。N4 Axion实例看似性价比提升,实则是为了吸引通用计算负载,进一步加深对Google Cloud基础设施的依赖。
物理限制方面:TPU 8t的9600颗规模依赖Google自研光互连和Jupiter网络,外部客户无法在自有数据中心复现,导致供应商锁定风险极高。TPU 8i的SRAM增加虽缓解推理延迟,但片上SRAM容量仍远小于HBM带宽的潜在需求,在超大模型(万亿参数)推理中可能遭遇尾部延迟问题。此外,Google未披露TPU 8t/8i的具体HBM容量和互连带宽,掩盖了与NVIDIANVLink和InfiniBand的对比劣势。
PRO 决策建议
【厂商(竞争对手)】
- NVIDIA:立即针对TPU 8t/8i的短板进行技术反击。强化NVLink 5和InfiniBand的互连优势,推出对比基准测试,突出TPU在万亿参数模型中的尾部延迟和HBM容量不足。同时加速GB300的推理优化,利用CUDA生态的成熟工具链(TensorRT、Triton)对抗JAX的封闭性。
- AWS/Amazon:加速Trainium3和Inferentia3的迭代,强调多租户隔离和混合云部署的灵活性,攻击Google TPU无法在本地或第三方数据中心运行的硬伤。推广SageMaker与Bedrock的跨模型支持,弱化Gemini Agent Platform的锁定效果。
【企业(CIO与架构师)】
- 对TPU 8t/8i进行零信任技术审计:要求Google提供详细的HBM规格、互连拓扑、尾部延迟分布,并与NVIDIA H100/B200进行独立第三方基准测试,特别是大规模分布式训练的线性扩展效率。
- 评估Gemini Enterprise Agent Platform的跨云可移植性:确认是否支持导出代理到AWS/Azure,或是否强制使用Google的Vertex AI和BigQuery。避免被Agentic Data Cloud的专有数据格式锁定。
- 考虑混合云策略:将关键AI负载保留在自有数据中心或第三方云,利用Kubernetes和开放模型(Llama、Mistral)保持弹性,仅在Google Cloud运行对TPU性能极度敏感的训练任务。
【投资者】
- 短期看多Google Cloud的AI基础设施领先,但需警惕资本开支压力:TPU 8t的庞大Pod规模(9600颗)需要巨额数据中心投资,可能压缩利润率。
- 关注NVIDIA的营收风险:如果TPU 8t在训练市场获得10%以上份额,将侵蚀NVIDIA的数据中心收入,但NVLink和CUDA的粘性使短期替代有限。
- 长期看好自研AI芯片赛道,但需辨别供应商集中度风险:Google、AWS、Azure的自研芯片均锁定其云平台,不利于企业多云战略,可能催生白盒AI加速器(如Tenstorrent、Groq)的机遇。
觉得这篇分析有用?
每周收到3-5条AI基础设施关键信号 →
💬 评论 (0)