情报
AI 生成的结构化厂商动态简报
英伟达与Emerald AI展示AI工厂动态能耗调节能力
英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。
思科联合英伟达验证私有AI基础设施快速微调能力
思科IT与英伟达合作,基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据,无需人工标注,使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。
Meta与Arm合作开发面向AI数据中心的新CPU
Meta宣布与Arm合作,共同开发针对AI工作负载优化的数据中心CPU。首款产品Arm AGI CPU旨在提升机架性能密度,支持大规模AI部署,并将通过Arm向生态开放,其板卡设计将通过OCP开源。
ARM推出AGI CPU:AI Agent时代的硅基础
ARM宣布推出Arm AGI CPU,这是其首款自有硅产品,基于Neoverse平台,专为agentic AI时代设计。该CPU优化大规模并行工作负载,在1OU配置中支持272核心/刀片,全机架达8160核心,性能比x86系统提高两倍以上,提升AI基础设施效率。
ARM推出AGI CPU芯片,进军AI基础设施市场
ARM于2026年3月推出首款自研AGI CPU生产级芯片,标志着从IP授权模式向完整硅解决方案提供商的战略转型。该芯片专为下一代AI基础设施设计,可能重塑数据中心处理器生态格局。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
NVIDIA 捐赠 GPU 动态资源分配驱动至 Kubernetes
NVIDIA 将 GPU 动态资源分配驱动程序捐赠给云原生计算基金会,支持 MPS 和 MIG 技术实现 GPU 智能共享与动态重配置。同时为 Kata Containers 引入 GPU 支持增强 AI 工作负载隔离,KAI Scheduler 加入 CNCF 沙盒项目。
NVIDIA IGX Thor边缘AI平台:8倍算力跃迁与ConnectX-7网络锁定
NVIDIA发布IGX Thor系列,基于Blackwell GPU和Arm Neoverse-V3AE CPU,提供最高5,581 FP4 TFLOPS算力、双200GbE RDMA网络及ISO 26262功能安全。通过Jetson/IGX引脚兼容和10年生命周期,构建从原型到生产的无缝迁移路径,但隐性锁定用户至NVIDIA专有硬件堆栈。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
NVIDIA发布OpenShell开源运行时,构建AI代理安全隔离架构
NVIDIA推出开源安全运行时OpenShell,为自主AI代理提供系统级沙箱隔离,实现应用操作与基础设施策略执行的分离。通过与思科、谷歌云等安全厂商合作,建立统一的运行时策略管理框架。同时发布参考栈NemoClaw简化OpenShell与Nemotron模型的部署。
思科发布AI代理安全组合方案,构建主动内生防护体系
思科发布AI Defense Explorer Edition红队测试工具、Agent Runtime SDK策略嵌入框架、开源DefenseClaw安全代理框架,并将零信任扩展至AI代理。该方案从测试、内嵌、框架、身份多维度构建AI代理安全,推动从被动防护转向主动内生设计。
思科推出DefenseClaw为OpenClaw提供运行时安全治理层
思科发布开源项目DefenseClaw,为OpenClaw AI代理提供运行时安全治理。该方案集成扫描工具和威胁检测能力,实现运行前扫描、运行时检测和权限强制控制。通过自动化安全治理降低AI代理部署风险,填补OpenShell沙箱之上的运营层空白。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
思科扩展零信任至AI代理并推出AI防御工具
思科将零信任访问扩展至AI代理身份管理,通过Duo IAM和Secure Access SSE实现细粒度控制。推出AI Defense Explorer自助工具进行红队测试和安全验证,并开源DefenseClaw框架集成NVIDIA沙箱。Splunk SOC引入AI代理功能转向自动化运营。
NVIDIA定义柔性AI工厂为可调度电网资产
NVIDIA联合能源公司推出柔性AI工厂概念,通过AI平台实现计算负载与电网需求动态协调。该方案使AI数据中心从能源消费者转变为具备电网支持能力的产消者,通过软件定义和AI优化提升能源系统韧性。
Check Point发布AI工厂安全蓝图:借NVIDIA BlueField将控制点下沉至GPU与LLM层
Check Point发布AI工厂安全架构蓝图,与NVIDIA BlueField DPU深度集成,将防火墙和威胁防护嵌入硬件层,覆盖从GPU服务器到LLM提示的四个安全层级。同时推出AI Factory Firewall,实现无CPU/GPU开销的硬件加速安全,旨在锁定AI基础设施安全控制权。
NVIDIA Blackwell架构实现25倍能效提升
NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。
NVIDIA阐述加速计算三阶段演进与软件定义数据中心战略
NVIDIA CEO黄仁勋提出加速计算三阶段演进模型,从单一GPU加速发展到全栈加速,最终进入软件定义、AI驱动的数据中心阶段。公司强调通过软件定义基础设施实现动态资源分配,并重申从芯片到应用的全栈AI解决方案战略。