N
NVIDIA
2026-06-01
Architecture Shift 影响: Major 置信: 92%

NVIDIA DSX开源平台:以电力管理API夺取AI数据中心控制权

内容摘要

NVIDIA发布DSX开源数据中心平台,通过精细电力管理使同等预算部署更多加速芯片。其核心是数字孪生验证与软件定义的电力分配,旨在将控制权从传统基础设施转向NVIDIA堆栈,实现更高芯片密度。

核心要点

NVIDIA在GTC台北2026发布DSX(Data Center Software eXtension)开源平台,直指数据中心电力效率瓶颈。核心能力包括:

  • 电力效率突破:通过软件定义的动态功率分配,DSX允许在相同电力预算下额外部署最多40%的加速芯片(如H100/B200)。这对供电受限的存量数据中心尤其关键,可绕过物理扩容。
  • 数字孪生验证:集成的数字孪生(Digital Twin)可模拟整个工厂的散热、功耗与性能,在物理安装前验证部署方案。黄仁勋宣称可实现“零成本全厂模拟”。
  • DGX Station for Windows:配套工作站配备748GB统一内存20 petaflops FP4算力800Gbps ConnectX-8 SuperNIC,支持本地运行万亿参数模型和数百个智能体(Agents),可选配RTX Pro 6000

该平台开源,提供规划、部署与监控工具套件,Q4 2026由主流系统集成商上市。

重要性说明

NVIDIA此举表面是开源工具,实则是控制平面转移的杀招:

  • 围合谁? 直接剑指Arista、Cisco等传统网络与DC管理厂商,以及Vertiv、Schneider等电力基础设施供应商。通过DSX,NVIDIA将电力分配与数字孪生验证的控制点从物理PDU/冷却系统上移到其GPU与NVLink网络堆栈。未来任何AI集群的容量规划必须通过DSX API,NVIDIA成为电力预算的最终仲裁者。
  • 锁定什么? 隐性锁定用户的运维工具链。DSX的监控与规划套件深度绑定NVIDIA Base CommandDGX OS,一旦采用,更换GPU平台意味着整个电力与容量管理工具链需推倒重来。企业将失去跨供应商的基础设施可移植性
  • 隐瞒了什么? 原文未提DSX对异构计算的支持。若用户部署非NVIDIA加速器(如AMD MI300XIntel Gaudi 3),DSX的功率分配算法能否公平调度?很可能存在算法歧视,优先保障NVIDIA芯片的电力配额,导致竞争对手芯片性能受抑。此外,数字孪生模拟的精度依赖于NVIDIA专有的功耗模型库,用户无法验证其真实性,存在黑箱风险

PRO 决策建议

【厂商】Arista、AMD、Intel应联合开发开放功率管理接口(Open Power Management Interface, OPMI)标准,基于RedfishDMTF规范,确保非NVIDIA加速器在DSX环境中获得公平电力配额。同时推出兼容OPMI的数字孪生参考架构,以开源工具(如OpenStack Watcher)对抗NVIDIA的封闭生态。
【企业】CIO与架构师必须进行零信任技术审计:要求NVIDIA提供DSX的功率分配算法白皮书,验证其是否对非NVIDIA硬件有歧视性策略。同时,在所有合同中加入可移植性条款,确保DSX不成为锁定工具,并要求独立第三方对数字孪生模拟结果进行基准测试。
【投资者】警惕NVIDIA通过DSX将AI数据中心控制权从硬件销售转向软件订阅。这虽能提升其ARPU,但也增加了反垄断风险。建议关注AMDIntel的联合生态反击,以及Arista在开放网络领域的替代方案。DSX的长期成功取决于企业是否接受供应商集中度风险

来源: AI Infra
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)