Agentic AI - AI基础设施情报搜索

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

Cisco 其他 2026-06-11

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

思科在Cisco Live上宣布Cisco Cloud Control，将网络基础设施与Splunk数据分析深度绑定，推出Agentic SRE/SOC等AI运维产品。该平台旨在通过统一控制平面管理数据、基础设施和AI信任，降低MTTR和成本，但实质是强化对用户网络和可观测性栈的锁定。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片，集成Blackwell RTX GPU和128GB统一内存，支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发，Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

Amazon 其他 2026-06-10

Graviton5 与 Nitro 形式化验证：AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权

AWS 推出第五代自研 ARM 处理器 Graviton5，搭载于 M9g/M9gd 实例，性能提升 25%，支持 PCIe Gen6 和 DDR5-8800，首次引入形式化验证的 Nitro Isolation Engine。Meta 已部署数千万核支撑 agentic AI 推理，ARM 在云 CPU 赛道上完成关键突破。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-06-08

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA与LG集团联合建设AI工厂，基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架，覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确，从冷却组件到机器人平台均深度绑定NVIDIA架构，形成排他性生态。

NVIDIA 其他 2026-06-08

NVIDIA联手斗山集团：以全栈物理AI平台重构工业自动化生态

NVIDIA与斗山集团扩大合作，将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS，并探索AI工厂电力（SMR、氢燃料电池）及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台，深度锁定工业自动化生态。

Huawei 产品发布 2026-06-05

华为云发布AICS灵衢智算集群：Token工业化时代的控制平面转移与Agent锁定

华为云发布四大Agentic Infra新品，核心为AICS灵衢智算集群（10万卡/200 EFLOPS），通过NPU直通CMS硬件、CCE VolcanoNext通智一体化调度引擎与AgentSphere安全沙箱，构建从算力、记忆到调度、安全的统一控制平面，旨在锁定大模型训练与Agent推理的全栈基础设施。

Cisco 其他 2026-06-03

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科宣布将Silicon One芯片用于校园网络，推出C9550/C9350系列智能交换机，配合Cloud Control平台，实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新，意图将控制平面从外围设备转移至芯片和云原生编排，以应对AI代理带来的持续流量和安全挑战。

Cisco 其他 2026-06-03

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

思科发布Secure Access Agent Gateway，将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份，在LLM、MCP工具、SaaS API等交互点实施策略，实现行动级审计和凭证注入，旨在解决代理自主行动带来的新安全风险。

Microsoft Azure 产品发布 2026-06-03

微软Maia 200量产+Cobalt 200预览：自研双芯合围NVIDIA，AI推理控制权转移

微软在Build 2026宣布Maia 200 AI推理芯片量产，Cobalt 200 ARM处理器预览，并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈，意图在推理环节降低对NVIDIA GPU的依赖，并锁定Azure AI工作负载。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

Intel 其他 2026-06-02

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+（288 e-cores），与 Perplexity 合作推出混合本地推理编排，与 Foxconn 共建机架级 AI 基础设施，与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色，意图将控制平面从 GPU 转移至 x86。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施，并展示由Vector Core Compute运营的完全解耦推理云（预填充用NVIDIA Blackwell，解码用RDU）。此举旨在将CPU重新置于AI推理核心，改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例，联合 Revolut、Mastercard 等金融机构，推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架，将金融数据处理从特征工程转向统一嵌入，实质是控制层向 NVIDIA 硬件生态转移。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark：Agentic AI PC架构从x86转向Arm+GPU紧耦合

Arm与NVIDIA合作推出的RTX Spark采用Arm Grace CPU与Blackwell RTX GPU通过统一内存紧密耦合，专为Agentic AI时代设计，提供超低延迟本地推理能力。该平台标志着Windows on Arm生态的重大突破，旨在满足开发者、创作者和游戏玩家的高性能AI计算需求。

情报

筛选

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

思科借Splunk整合构建Cisco Cloud Control：控制平面向AI原生统一平台迁移

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

Graviton5 与 Nitro 形式化验证：AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA联手斗山集团：以全栈物理AI平台重构工业自动化生态

华为云发布AICS灵衢智算集群：Token工业化时代的控制平面转移与Agent锁定

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

微软Maia 200量产+Cobalt 200预览：自研双芯合围NVIDIA，AI推理控制权转移

微软Build大会：从芯片到云构建Agent时代统一生态

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

Arm与NVIDIA联手推出RTX Spark：Agentic AI PC架构从x86转向Arm+GPU紧耦合