情报
AI 生成的结构化厂商动态简报
OpenAI发布Dreaming V3:ChatGPT后台自动记忆系统,计算效率提升5倍
OpenAI于6月4日面向Plus/Pro用户发布Dreaming V3——ChatGPT全新后台自动记忆系统。与旧版需用户显式指令不同,Dreaming V3在对话结束后自动运行后台进程,综合偏好、约束、项目和时间上下文。核心改进:计算效率提升约5倍使免费用户可用;时效性感知(行程结束后停止推荐);Plus/Pro获双倍存储。争议:2月arXiv研究揭示96%记忆为系统单方面创建,面临8月生效的欧盟AI法案透明度审查。
AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权
AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。
思科Cloud Control+AI Canvas:用40年数据铸就AgenticOps,控制点从硬件转向AI决策平面
思科在Cisco Live 2026发布Cloud Control统一管控平台与AI Canvas协同环境,基于Splunk数据底座和专用目的模型,实现AgenticOps运维模式。同时,Silicon One架构统一园区与云交换机,并推出量子安全推送服务。此举标志着思科从网络设备商向AI基础设施运维平台的战略转型,核心控制点转移至AI智能体决策层。
微软Maia 200量产+Cobalt 200预览:自研双芯合围NVIDIA,AI推理控制权转移
微软在Build 2026宣布Maia 200 AI推理芯片量产,Cobalt 200 ARM处理器预览,并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈,意图在推理环节降低对NVIDIA GPU的依赖,并锁定Azure AI工作负载。
微软Build大会:从芯片到云构建Agent时代统一生态
微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。
GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
Build 2026:Project Polaris自研模型替代GPT-4 Turbo,GitHub Copilot开启去OpenAI化
微软在Build 2026开发者大会发布Project Polaris自研编码模型,计划2026年8月起替代OpenAI GPT-4 Turbo成为GitHub Copilot默认推理引擎,3个月过渡期可选保留旧模型。这标志着微软首次从模型层正式脱离对OpenAI的依赖。同时Anthropic Claude已集成进Copilot,支持多模型draft+review协同工作流。微软首次公开将Claude列为主要追赶目标,战略信号:模型层自立,分发和运行时才是持久护城河。
AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台
AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。
Cisco Talos威胁狩猎扩展:跨端点、网络与身份域锁定用户生态
Cisco Talos宣布将威胁狩猎服务从端点扩展到Cisco Firewall(网络流量)和Cisco Duo/Identity Intelligence(身份活动),利用AI引擎持续执行假设驱动搜索,通过Cisco Security Cloud Control统一门户交付发现结果。此举旨在捕获低于传统检测阈值的隐蔽攻击信号。
NVIDIA发布Vera 88核Arm CPU:控制点从x86转向NVIDIA,智能体计算架构重构
NVIDIA在GTC台北2026发布首款独立数据中心CPU Vera,基于88核Olympus Arm架构,单片mesh网络,LPDDR5X带宽1.2TB/s,性能1.8倍x86。通过NVLink-C2C与GPU紧密耦合,首批客户包括OpenAI和Anthropic,Q3 2026投产。此举将控制点从Intel/AMD移向NVIDIA,重构智能体计算架构。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
Check Point推AEV:以AI代理验证暴露面,应对自主攻击新威胁
Check Point发布Agentic Exposure Validation (AEV),利用AI代理模拟攻击者推理,结合威胁情报与资产上下文,安全证明哪些漏洞真正可被利用。AEV作为CTEM计划关键组件,帮助团队在AI自主攻击时代从被动补丁转向主动验证。
微软Fara1.5浏览器Agent开源权重,72%成功率碾压闭源对手
微软发布Fara1.5系列(4B/9B/27B)浏览器Computer-Use Agent,基于Qwen3.5微调,在Online-Mind2Web达72%成功率,超越OpenAI Operator(58.3%)和Gemini 2.5 CU(57.3%)。开源权重并配套MagenticLite沙盒,但存在视觉提示注入和凭证暴露等安全风险。
Zscaler Project AI-Guardian:Zero Trust控制平面向AI Agent身份转移
Zscaler启动Project AI-Guardian,联合六大GSI将Zero Trust框架扩展至AI Agent,推出AI Protect组合。核心变动在于将非人类身份(Agent)纳入细粒度权限控制与持续红队测试,重新定义企业AI安全访问边界。
Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命
Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。
AI Agent工作负载引爆CPU结构性短缺,Arm与AMD重塑服务器价值链
AI推理与Agent编排导致CPU需求暴增,CPU-GPU配比从1:8向1:1演进。AMD EPYC交付周期8-12周,Intel Xeon部分配置长达6个月,Arm 3nm 136核AGI处理器联合Meta/Cerebras/Cloudflare/OpenAI,总需求超200亿美元。CPU取代GPU成为AI基础设施新瓶颈,价值链正在被Arm和AMD重新分配。
Cisco借MRC协议推销SRv6:AI网络生态的隐性控制权争夺
Cisco在博客中宣称MRC协议依赖其主导的SRv6架构,并强调SRv6在AI超算中的三大优势:应用驱动、静态路由可靠性、确定性探测。这实为Cisco试图通过SRv6标准锁定AI网络生态,对抗NVIDIA Spectrum-X和Arista的方案。
OpenAI推出Daybreak:AI持续安全防御平台
OpenAI于5月11日推出Daybreak网络安全项目,结合GPT-5.5-Cyber与Codex Security,将安全嵌入开发全流程,实现威胁建模→漏洞监控→补丁验证闭环。对标Anthropic Glasswing,争夺AI安全平台市场。
微软M365 Copilot集成GPT-5.5 Instant:模型选择权成为企业AI新控制平面
微软宣布将GPT-5.5 Instant模型集成至M365 Copilot、Copilot Studio和Foundry,同时提供OpenAI与Anthropic Claude的模型选择。这标志着企业AI部署从单一模型锁定转向平台级模型编排与治理,控制点从模型能力转移至路由与策略层。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。