情报
AI 生成的结构化厂商动态简报
Google I/O 2026全面押注Agentic AI:Antigravity平台与TPU 8t/8i重构AI基础设施控制权
Google在I/O 2026发布Gemini 3.5 Flash(4倍输出速度)、Antigravity 2.0多Agent编排平台、TPU 8t/8i(训练3倍/推理2倍性能提升)及Gemini Spark个人助手,全面转向Agentic AI系统级基础设施。通过Antigravity平台和定制TPU,Google意图锁定开发者生态,将控制点从模型API转移至编排与硬件层。
Intel Core Ultra Series 3 以集成SoC替代离散GPU,重塑边缘机器人推理性价比
Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU,成为Sensory AI等多家机器人公司的边缘推理主力,完全替代昂贵、高功耗的离散GPU。通过异构计算,机器人可在本地运行视觉、语言、运动等多智能体,无需云端,显著降低总拥有成本与部署门槛。
AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存
AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。
AI Agent工作负载引爆CPU结构性短缺,Arm与AMD重塑服务器价值链
AI推理与Agent编排导致CPU需求暴增,CPU-GPU配比从1:8向1:1演进。AMD EPYC交付周期8-12周,Intel Xeon部分配置长达6个月,Arm 3nm 136核AGI处理器联合Meta/Cerebras/Cloudflare/OpenAI,总需求超200亿美元。CPU取代GPU成为AI基础设施新瓶颈,价值链正在被Arm和AMD重新分配。
微软WinHEC 2026推Driver Quality Initiative:驱动控制权从IHV向微软转移
微软在WinHEC 2026推出Driver Quality Initiative (DQI),核心是推动第三方内核模式驱动向用户模式驱动或微软类驱动转移,同时强化信任验证、生命周期管理和质量度量。此举旨在系统性提升Windows驱动质量,但实质是微软对驱动生态控制权的进一步集中。
Cloudflare 三连补丁破解 ClickHouse 分区膨胀锁竞争瓶颈
Cloudflare 在计费管道中遭遇 ClickHouse 性能骤降,根源是分区键改为 (namespace, day) 后,数据部分数量激增导致全局互斥锁争用。他们通过共享锁、延迟复制向量和二分查找三个补丁,将查询延迟降低 50% 以上,并最终解耦了查询耗时与分区数量的关联。
Cisco推N9300 Smart Switch融合安全,AI数据中心控制点转向网络基础设施
Cisco在ONUG 2026发布Nexus One架构与N9300系列智能交换机,将L4分段、Hypershield、eBPF Live Protect及与NVIDIA BlueField DPU集成的防火墙直接嵌入网络,旨在为AI工作负载提供无性能瓶颈的深度安全,同时通过AgenticOps和AI Canvas实现智能运维。
AWS AgentCore自主支付:AI代理的货币化控制点与安全风险双重升级
AWS在Bedrock AgentCore中预览了托管支付能力,允许AI代理自主支付API、MCP服务器等费用,与Coinbase和Stripe集成。同时推出Agent Toolkit for AWS和MCP Server GA,强化代理开发与安全控制。此举将AI代理从辅助工具推向自主执行实体,但引入新的安全与锁定风险。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
英特尔在Computex 2026强调CPU在AI计算中的关键角色
英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局
NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。
思科发布AI模型溯源宪法,定义权重级衍生关系标准
思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。