M
MediaTek
2026-06-23
Technology Integration 影响: Important 置信: 85%

联发科独家接单谷歌TPU v9推理升级款Triggerfish,SRAM缓存翻倍

内容摘要

谷歌计划推出TPU v9推理优化升级款Triggerfish,由联发科独家代工。该芯片SRAM缓存规模为前代2-3倍,DRAM升级至HBM4E,并引入simulation die用于本地管理。预计2027年底投产,生命周期出货100-200万颗,单价高出约三成。

核心要点

据郭明錤报告,谷歌将推出代号Triggerfish的TPU v9升级款,专为推理优化。核心改进包括:片内SRAM缓存规模是前代Humufish的2至3倍,使更大活跃工作集保留在本地,降低数据传输开销,提升解码效率;片外DRAM从HBM4升级至HBM4E,进一步缓解内存墙。此外,引入simulation die,分析师推测可能用于本地TPU管理、训推切换、强化学习与AI智能体协作。

联发科从TPU v7e开始进入谷歌AI芯片设计体系,至TPU v8形成博通与联发科并行的双供应商格局,如今TPU v9系列均由联发科主导整合,标志其从移动通信芯片向AI数据中心芯片战略转型。Triggerfish预计2027年底投产、2028年底放量,生命周期出货规模100至200万颗,单价较Humufish高出约三成。

重要性说明

表面是推理性能提升,实质是谷歌在防守英伟达的CUDA生态合围,通过定制TPU的SRAM膨胀HBM4E将推理工作负载锁定在自家基础设施内,剥夺用户切换至通用GPU的弹性。

隐性锁定:simulation die暗示谷歌试图将训推切换强化学习等控制平面功能固化到芯片级,一旦部署,用户将无法使用第三方管理工具链(如Kubernetes GPU Operator),被迫绑定谷歌的专有调度与监控体系。

工程短板:虽然SRAM容量翻倍,但尾部延迟问题未解决——在大规模分布式推理中,PFC/ECN拥塞控制瓶颈依然存在,且片内SRAM与HBM4E之间的一致性协议可能引入新的线端阻塞。此外,2028年才放量,届时英伟达Rubin架构已发布,性能代差可能缩小甚至反超。

PRO 决策建议

【厂商】竞争对手(如博通英伟达AMD):立即向谷歌的TPU客户推销开放标准替代方案。强调simulation die的锁定风险——一旦采用,客户将丧失训推切换的灵活性。博通应加速推出基于UCIe的chiplet方案,提供可插拔的SRAM和HBM4E组合,打破谷歌的专有封装。
【企业】CIO/架构师:进行严格的零信任技术审计。要求谷歌公开simulation die的完整API规范,评估能否与现有KubernetesPrometheus等开源工具集成。警惕SRAM膨胀带来的供应商集中度风险——未来扩容只能依赖联发科单一来源,缺乏议价权。建议保留至少30%推理负载在英伟达H200/B200AMD MI350上作为对冲。
【投资者】看穿公关辞令:联发科拿下独家订单是利好,但2028年才放量,期间英伟达RubinAMD MI400将迭代。关注联发科是否具备HBM4E的封装良率,以及simulation die的IP归属权。长期看,谷歌TPU仍局限于自有生态,无法撼动英伟达在第三方云市场的统治地位。

来源: IT之家
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)