N
NVIDIA
2026-05-29
Product Launch 影响: Major 置信: 95%

NVIDIA Blackwell Ultra GB300 NVL72:FP4算力1.44 EFLOPS,AI工厂性能跃升50倍

内容摘要

NVIDIA发布Blackwell Ultra GB300 NVL72机架系统,集成72颗Blackwell Ultra GPU和36颗Grace CPU,FP4稀疏算力达1,440 PFLOPS,配备20TB HBM3e和130TB/s NVLink,相比Hopper AI工厂输出提升50倍,已上市。

核心要点

NVIDIA在GTC 2026上正式推出Blackwell Ultra GB300 NVL72,这是目前全球最密集的AI计算平台。核心配置:72颗Blackwell Ultra GPU(采用Grace CPUARM Neoverse V2架构,共2,592核心)与36颗Grace CPU协同。算力方面,FP4 Tensor Core稀疏算力达1,440 PFLOPS,稠密1,080 PFLOPS;FP8/FP6为720 PFLOPS;INT8为24 POPS。
内存子系统:72颗GPU合计20TB HBM3e,带宽576 TB/s;36颗Grace CPU配备17TB LPDDR5X,带宽14 TB/s;系统快速内存总量37TB。相比前代Blackwell,HBM3e容量提升1.5倍
互联架构:第五代NVLink提供130 TB/s双向带宽;每GPU通过ConnectX-8 SuperNIC提供800 Gb/s网络带宽,支持Quantum-X800 InfiniBandSpectrum-X Ethernet
性能对比(基于DeepSeek-R1,ISL=32K, OSL=8K, FP4 Dynamo disaggregation测试):相比Hopper平台,AI工厂整体输出提升50倍,用户响应速度提升10倍,每兆瓦吞吐效率提升5倍FP4稠密算力较Blackwell非Ultra版本提升1.5倍,注意力层性能提升2倍。视频生成(Cosmos-1.0-Diffusion-7B):5秒720p 60FPS视频实时生成,较Hopper的90秒提速30倍。管理软件:NVIDIA Mission Control提供全栈编排。散热:全液冷设计。上市状态:Available Now。

重要性说明

NVIDIA此动作表面是性能升级,本质是在防守AMD MI400系列谷歌TPU v6等竞品逼近,通过Blackwell Ultra的极致密度锁定用户未来的AI基础设施投资。其隐性锁定在于:NVLink 130 TB/sConnectX-8网络生态迫使企业必须采用NVIDIA全套方案(GPU+CPU+网络+管理软件),剥夺了混合部署AMD Instinct英特尔Gaudi的架构弹性。
工程短板与成本陷阱:全液冷设计虽提升散热效率,但意味着现有风冷数据中心必须大规模改造,改造成本未在宣传中提及。20TB HBM3e容量虽大,但尾部延迟(Tail Latency)在72-GPU NVLink域内因拥塞控制(PFC/ECN)可能成为瓶颈,尤其当跨机架Spectrum-X以太网与InfiniBand混用时,RoCEv2PFC风暴风险未消除。FP4算力的1.44 EFLOPS依赖于稀疏计算,实际稠密仅1.08 EFLOPS,且FP4精度对某些模型收敛性有影响,NVIDIA未提供FP8/FP16下的全精度对比。Mission Control管理软件进一步锁定用户到NVIDIA的控制平面,阻止第三方编排工具(如Kubernetes + Volcano)的深度集成。

PRO 决策建议

【厂商(AMD、英特尔、谷歌)】应瞄准NVIDIA的全栈锁定软肋,推出开放式互连标准(如UALinkCXL)和白盒网络方案,强调跨供应商GPU集群的灵活性。针对全液冷高改造成本,推广风冷兼容的高密度AI服务器(如AMD MI400+Infinity Fabric)。同时开发FP4/FP8混合精度训练框架,降低对NVIDIA稀疏算力的依赖。
【企业CIO/架构师】立即进行零信任技术审计:评估现有数据中心能否支持液冷改造,计算改造预算(每机架约$50-100K)。要求NVIDIA提供FP8/FP16全精度性能数据,并测试跨机架NVLink域尾部延迟PFC风暴。强制要求Mission Control支持Kubernetes原生API,否则考虑AMD+英特尔混合方案以保留架构弹性。
【投资者】看穿公关辞令:50倍提升基于特定稀疏模型(DeepSeek-R1),通用场景增益可能低于宣称。全液冷网络锁定将推高客户总拥有成本,抑制大规模采购。关注AMD英特尔UALink联盟的进展,若开放标准获得支持,NVIDIA的NVLink护城河将受侵蚀。

来源: AI Infra
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)