情报
AI 生成的结构化厂商动态简报
NVIDIA发布物理AI数据工厂蓝图及前沿模型
NVIDIA在GTC 2026发布三大物理AI前沿模型和Physical AI Data Factory开放参考架构,通过Cosmos世界模型和OSMO操作符将计算转化为合成训练数据。同时推出Omniverse DSX数字孪生仿真蓝图,工业机器人厂商正采用该框架验证应用并集成Jetson模块实现实时AI推理。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
NVIDIA组建开放模型联盟推动Nemotron生态发展
NVIDIA宣布成立全球首个开放前沿模型联盟,联合Mistral AI等机构共同开发基础模型。联盟成员将共享数据、算力和专业知识支持模型后训练,Nemotron模型下载量已超4500万次。该举措旨在推动开放模型生态创新,对抗封闭模型体系。
英特尔发布18A制程商用PC平台,强化AI推理能力
英特尔发布基于18A制程的酷睿Ultra 3系列商用PC处理器,AI性能较前代提升4倍。同步推出Arc Pro B70独立显卡,针对企业AI工作负载优化,在上下文窗口和多用户响应方面优于竞品。vPro平台与Intune深度集成提升企业设备管理效率。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
英伟达与Emerald AI展示AI工厂动态能耗调节能力
英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。
思科联合英伟达验证私有AI基础设施快速微调能力
思科IT与英伟达合作,基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据,无需人工标注,使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。
Meta与Arm合作开发面向AI数据中心的新CPU
Meta宣布与Arm合作,共同开发针对AI工作负载优化的数据中心CPU。首款产品Arm AGI CPU旨在提升机架性能密度,支持大规模AI部署,并将通过Arm向生态开放,其板卡设计将通过OCP开源。
ARM推出AGI CPU:AI Agent时代的硅基础
ARM宣布推出Arm AGI CPU,这是其首款自有硅产品,基于Neoverse平台,专为agentic AI时代设计。该CPU优化大规模并行工作负载,在1OU配置中支持272核心/刀片,全机架达8160核心,性能比x86系统提高两倍以上,提升AI基础设施效率。
ARM推出AGI CPU芯片,进军AI基础设施市场
ARM于2026年3月推出首款自研AGI CPU生产级芯片,标志着从IP授权模式向完整硅解决方案提供商的战略转型。该芯片专为下一代AI基础设施设计,可能重塑数据中心处理器生态格局。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
NVIDIA 捐赠 GPU 动态资源分配驱动至 Kubernetes
NVIDIA 将 GPU 动态资源分配驱动程序捐赠给云原生计算基金会,支持 MPS 和 MIG 技术实现 GPU 智能共享与动态重配置。同时为 Kata Containers 引入 GPU 支持增强 AI 工作负载隔离,KAI Scheduler 加入 CNCF 沙盒项目。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
NVIDIA发布OpenShell开源运行时,构建AI代理安全隔离架构
NVIDIA推出开源安全运行时OpenShell,为自主AI代理提供系统级沙箱隔离,实现应用操作与基础设施策略执行的分离。通过与思科、谷歌云等安全厂商合作,建立统一的运行时策略管理框架。同时发布参考栈NemoClaw简化OpenShell与Nemotron模型的部署。
思科发布AI代理安全组合方案,构建主动内生防护体系
思科发布AI Defense Explorer Edition红队测试工具、Agent Runtime SDK策略嵌入框架、开源DefenseClaw安全代理框架,并将零信任扩展至AI代理。该方案从测试、内嵌、框架、身份多维度构建AI代理安全,推动从被动防护转向主动内生设计。
思科推出DefenseClaw为OpenClaw提供运行时安全治理层
思科发布开源项目DefenseClaw,为OpenClaw AI代理提供运行时安全治理。该方案集成扫描工具和威胁检测能力,实现运行前扫描、运行时检测和权限强制控制。通过自动化安全治理降低AI代理部署风险,填补OpenShell沙箱之上的运营层空白。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
思科扩展零信任至AI代理并推出AI防御工具
思科将零信任访问扩展至AI代理身份管理,通过Duo IAM和Secure Access SSE实现细粒度控制。推出AI Defense Explorer自助工具进行红队测试和安全验证,并开源DefenseClaw框架集成NVIDIA沙箱。Splunk SOC引入AI代理功能转向自动化运营。