G
Google
2026-05-19
Architecture Shift 影响: Major 置信: 85%

Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

内容摘要

Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

核心要点

Google I/O 2026主题演讲中,Sundar Pichai宣布了全栈AI基础设施的重大升级。

  • TPU 8t:针对大规模预训练优化,原始计算力是上一代TPU v5的三倍。通过JAXPathways,训练不再受限于单个数据中心,可跨站点无缝分布,扩展至超过100万TPU,实现全球最大训练集群,将训练周期从数月缩短至数周。
  • TPU 8i:针对推理设计,大幅降低延迟,性能功耗比提升2倍
  • Gemini 3.5 Flash:在几乎所有基准上超越Gemini 3.1 Pro,尤其在GDPVal(经济价值任务)上实现惊人跃升。输出速度达到每秒4倍于其他前沿模型,处于智能与速度的领先象限。
  • Gemini Omni:新多模态模型,可从任何输入生成任何输出模态(视频为首发),结合Gemini智能与生成媒体模型。
  • SynthID:已标注超过1000亿图像/视频和6万年音频资产。OpenAI、Nvidia、Kakao、Eleven Labs宣布采用,与Content Credentials整合至Search和Chrome。
  • 资本支出从2022年310亿美元增至2026年预计1800-1900亿美元,反映对AI基础设施的巨额投入。

重要性说明

表面是技术飞跃,实则是Google通过定制硬件与软件栈的深度绑定,对AI工作负载进行控制平面转移

  • 锁定训练工作流JAX/Pathways跨数据中心训练架构看似灵活,实则将用户训练流程深度嵌入Google的调度与网络协议(如gRPCBGP定制)。一旦采用,迁移至NVIDIA GPUAWS Trainium将面临巨大的代码重构成本和性能退化。这是针对NVIDIA云竞争对手的合围。
  • 推理速度的隐性代价Gemini 3.5 Flash的4倍输出速度可能依赖TPU 8i的特定Systolic Array架构和GoogleTensorFlow Lite运行时。在通用GPU(如H100/B200)上运行相同模型,速度优势可能消失,且尾部延迟在跨数据中心部署时因PFC/ECN拥塞控制瓶颈而恶化。
  • 成本陷阱1800-1900亿美元资本支出中,大部分用于定制TPU和专用网络(如Jupiter数据中心网络)。用户使用Google Cloud时,隐性成本包括专有网络带宽预留、TPU预留实例的长期承诺,以及Pathways跨站点训练带来的额外WAN带宽费用。
  • SynthID的生态绑架:看似开放,但Content CredentialsGoogle Search/Chrome深度集成,迫使内容平台必须采用Google标准才能获得搜索排名可见性,这是对C2PA联盟的打击。

PRO 决策建议

【厂商】(竞争对手:AWS、Microsoft Azure、NVIDIA)

  • AWSAzure应立即强调Google TPU的封闭性,推广OpenXLAMLIR等开放编译框架,并展示其TrainiumMaia芯片在主流模型(如Llama 3GPT-4)上的实际性能,避免被JAX/Pathways生态边缘化。
  • NVIDIA应加速CUDANCCL的跨数据中心优化,推出类似PathwaysDGX SuperPOD多站点训练方案,并联合HPEDell提供白盒网络方案以降低WAN成本。

【企业】(CIO与架构师)
  • Google CloudTPUPathways进行零信任技术审计:测试模型在不同硬件(GPUTPU)上的可移植性,评估跨数据中心训练的实际WAN带宽费用和尾部延迟影响。
  • 要求Google提供JAX代码的MLIR标准导出能力,确保不锁定在TPU。优先选择支持OpenXLA的云厂商。

【投资者】
  • 看穿1800-1900亿美元资本支出背后的信号:Google正押注定制芯片以摆脱对NVIDIA的依赖,但TPU 8t/8i的规模经济尚未验证。关注Google CloudAI收入增长与TPU利用率的关联。若SynthID成为行业标准,Google将获得内容认证的定价权,但可能引发反垄断审查。

来源: Google Blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)