情报
AI 生成的结构化厂商动态简报
英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权
英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。
GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
NVIDIA发布Vera 88核Arm CPU:控制点从x86转向NVIDIA,智能体计算架构重构
NVIDIA在GTC台北2026发布首款独立数据中心CPU Vera,基于88核Olympus Arm架构,单片mesh网络,LPDDR5X带宽1.2TB/s,性能1.8倍x86。通过NVLink-C2C与GPU紧密耦合,首批客户包括OpenAI和Anthropic,Q3 2026投产。此举将控制点从Intel/AMD移向NVIDIA,重构智能体计算架构。
NVIDIA BlueField DPU硬件隔离安全:将AI工厂控制点从软件转向硅片
NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈(Argus、Vault、Flow),通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片,在不影响AI性能前提下提供分布式全栈保护,但深度绑定Vera Rubin平台,形成生态锁定。
NVIDIA Vera CPU:自研Olympus核心与LPDDR5X,专为Agentic AI工厂重塑CPU设计点
NVIDIA发布Vera CPU,集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络,针对Agentic AI和强化学习中的CPU执行瓶颈,宣称比x86架构性能提升1.8倍,并将内存功耗降至30W以下,推动AI工厂从“每核心成本”向“每Token成本”转变。
Intel以Xeon 6+与E835重塑AI控制平面:CPU重新成为agentic AI的编排核心
Intel发布基于Intel 18A的Xeon 6+处理器(288个E-core)、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心,作为agentic AI工作负载的编排与数据移动控制平面,并试图通过E835以太网组合锁定AI数据中心网络标准。
NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态
NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。
NVIDIA Vera CPU实测碾压x86:Agentic AI时代的内存带宽霸权
Phoronix基准测试显示,NVIDIA Vera CPU凭借88核自研Olympus核心(Armv9.2)、1.2TB/s LPDDR5X带宽及450W TDP,在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越,Linux内核编译仅20秒。
Intel CEO断言AI推理时代CPU/GPU配比逆转,Multi-Agent将CPU推回算力中心
Intel CEO Lip-Bu Tan预测AI推理推动CPU/GPU配比从1:8演进至1:1甚至4:1,Multi-Agent三大刚性需求(OS调度、KVCache卸载、高并发工具调用)将CPU从配角变主角。NVIDIA、AMD、Intel三路CPU量产共振,确认CPU需求大周期。
NVIDIA Vera CPU冲击x86:1.5倍性能与4倍密度,AI推理全栈锁定
据传闻,NVIDIA将在Computex 2026展示自研通用CPU Vera,性能达x86的1.5倍、吞吐量2倍、机架密度4倍。FY2027出货目标120万颗,FY2028达420万颗。Vera旨在满足AI推理时代CPU/GPU配比从1:8向1:1演进的需求,与Grace双线并行,构建GPU+CPU全栈生态。
Intel Core Ultra Series 3 以集成SoC替代离散GPU,重塑边缘机器人推理性价比
Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU,成为Sensory AI等多家机器人公司的边缘推理主力,完全替代昂贵、高功耗的离散GPU。通过异构计算,机器人可在本地运行视觉、语言、运动等多智能体,无需云端,显著降低总拥有成本与部署门槛。
AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存
AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
英特尔在Computex 2026强调CPU在AI计算中的关键角色
英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。
NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局
NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态
Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
微软发布Copilot Studio多智能体系统,推动企业AI架构互联
微软宣布Copilot Studio的多智能体系统全面上市,核心是通过开放协议(A2A)、与Fabric及Microsoft 365 Agents SDK的集成,实现跨工具、跨数据源的智能体协同编排。此举旨在将孤立的AI体验转变为可规模化协作的智能体系统,并增强了提示构建与治理控制。