情报
AI 生成的结构化厂商动态简报
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
英伟达与Emerald AI展示AI工厂动态能耗调节能力
英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
NVIDIA Blackwell架构实现25倍能效提升
NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。
思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化
思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU,支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化,可实时分配PCIe GPU资源。该方案提供验证设计蓝图,加速AI推理、视觉AI等多工作负载的规模化部署。
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。
NVIDIA联合电信运营商构建分布式AI推理网格
NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。
HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric
HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。
Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全
Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。
英特尔至强6成为NVIDIA DGX Rubin主机CPU,强化AI推理基础设施
英特尔至强6处理器被选为NVIDIA DGX Rubin NVL8 AI系统的主机CPU,提供3倍内存带宽提升和全路径机密计算能力。该合作凸显了CPU在AI推理负载中负责数据编排、调度和安全的架构价值。
英伟达发布Nemotron 3 Super,优化智能体AI推理架构
英伟达推出1200亿参数Nemotron 3 Super模型,采用混合MoE架构结合Mamba与Transformer层,实现5倍吞吐量提升。该模型专为多智能体工作流设计,支持100万令牌上下文窗口,解决任务目标漂移问题。通过开放权重和云服务部署,降低企业智能体应用门槛。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。
NVIDIA推出RTX PRO Server虚拟化方案优化游戏开发AI基础设施
NVIDIA发布RTX PRO Server,基于RTX PRO 6000 GPU和vGPU软件构建集中式虚拟化GPU平台。支持MIG技术将单GPU划分为48个用户实例,提升资源利用率和团队协作效率。整合AI训练与图形工作流,实现动态资源分配和跨地域开发统一。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
思科联合NVIDIA推出澳大利亚首个主权AI工厂
思科与Sharon AI合作,在澳大利亚部署基于1024个NVIDIA Blackwell Ultra GPU的AI工厂,整合UCS服务器、Nexus Hyperfabric和VAST Data存储,提供境内数据处理的AI基础设施。
NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍,锁定Blackwell生态
NVIDIA与Black Forest Labs合作,在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile,将FLUX.2推理延迟较H200降低6.3x(单卡)至10.2x(双卡),内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。