情报
AI 生成的结构化厂商动态简报
NVIDIA RTX Spark超级芯片:将AI代理与AAA游戏压缩进超薄笔记本,锁定个人计算生态
NVIDIA发布RTX Spark超级芯片,集成30年GPU/CPU/AI创新,实现1440p 144fps光追游戏与本地AI代理推理,支持DLSS 4.5。与KRAFTON、NC、Riot Games等合作,在韩国PC Bang首发,标志NVIDIA从独立GPU向个人计算SoC的战略转折。
AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权
AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。
华为云发布AICS灵衢智算集群:Token工业化时代的控制平面转移与Agent锁定
华为云发布四大Agentic Infra新品,核心为AICS灵衢智算集群(10万卡/200 EFLOPS),通过NPU直通CMS硬件、CCE VolcanoNext通智一体化调度引擎与AgentSphere安全沙箱,构建从算力、记忆到调度、安全的统一控制平面,旨在锁定大模型训练与Agent推理的全栈基础设施。
Cisco AI Defense与AppOmni集成:将运行时护栏扩展到SaaS AI代理
Cisco宣布AI Defense与AppOmni集成,通过AppOmni AgentGuard实时拦截层,将自定义护栏策略扩展到Microsoft 365 Copilot、ServiceNow Now Assist等SaaS AI代理。统一策略引擎覆盖MCP、聊天、代理间通信,防止提示注入、工具利用和数据泄露。
Cloudflare收购VoidZero:以Vite整合控制开发者部署管道
Cloudflare收购开源JavaScript工具链公司VoidZero,将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台,实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期,并推动意图驱动的基础设施自动预配。
思科Silicon One扩展至校园:以芯片内嵌控制锁定Agentic AI网络
思科宣布将Silicon One芯片用于校园网络,推出C9550/C9350系列智能交换机,配合Cloud Control平台,实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新,意图将控制平面从外围设备转移至芯片和云原生编排,以应对AI代理带来的持续流量和安全挑战。
思科Agent Gateway:零信任从访问控制升级为AI代理行动控制
思科发布Secure Access Agent Gateway,将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份,在LLM、MCP工具、SaaS API等交互点实施策略,实现行动级审计和凭证注入,旨在解决代理自主行动带来的新安全风险。
思科Cloud Control+AI Canvas:用40年数据铸就AgenticOps,控制点从硬件转向AI决策平面
思科在Cisco Live 2026发布Cloud Control统一管控平台与AI Canvas协同环境,基于Splunk数据底座和专用目的模型,实现AgenticOps运维模式。同时,Silicon One架构统一园区与云交换机,并推出量子安全推送服务。此举标志着思科从网络设备商向AI基础设施运维平台的战略转型,核心控制点转移至AI智能体决策层。
微软Maia 200量产+Cobalt 200预览:自研双芯合围NVIDIA,AI推理控制权转移
微软在Build 2026宣布Maia 200 AI推理芯片量产,Cobalt 200 ARM处理器预览,并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈,意图在推理环节降低对NVIDIA GPU的依赖,并锁定Azure AI工作负载。
微软Build大会:从芯片到云构建Agent时代统一生态
微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。
思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤
思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。
英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权
英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。
Build 2026:Office 365 Agent Mode发布,多Agent跨文档协作
微软在Build 2026发布Office 365 Copilot Agent Mode,6月下旬向M365订阅用户推出。多个持久化AI Agent同时运行在Word、Excel、Teams和Outlook,每个agent维护独立上下文、权限和记忆。Multi-agent canvas拖拽串联agent。Agent以命名参与者身份加入Teams频道。底层混合GPT-5.5-turbo和Phi-4-mini。自定义Agent Store Q4 2026开放。
Build 2026:Windows Agent Framework MIT开源,Agent Store 85%分成
微软在Build 2026以MIT许可开源Windows Agent Framework v1.0,支持YAML manifest跨本地Windows、Windows 365和Azure Arc部署agent。Windows Agent Runtime作为后台服务管理agent生命周期、内存和权限,支持细粒度规则引擎。Windows Agent Store提供85%开发者分成。Copilot Workspace脱离beta。今年无Windows 12,OS核心变革是agent而非版本号。
Build 2026:AgentGuard发布——AI Agent角色权限、DLP与审计治理层
微软在Build 2026发布AgentGuard,首个由主要平台厂商推出的AI Agent专用治理与安全控制层。提供角色权限管理(RBAC)、数据防泄露(DLP)和全链路审计日志。IT管理员可定义细粒度策略,如agent不可向外部API发送财务数据。将集成Purview合规管理器,预计2026年底上线。此前企业AI Agent治理依赖自制方案,AgentGuard是首个平台级原生集成方案。
Cisco Live 2026:AI Defense升级Agent安全,Policy Studio与自适应红队重塑策略管理
Cisco在Live 2026发布AI Defense三大升级:自适应红队测试、Policy Studio自然语言策略定义、Agent供应链安全扫描。同时推出AgenticOps自主网络运维,并原生集成Amazon Bedrock、Google ADK、LangChain等主流Agent框架,构建跨平台Agent安全生态。
Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权
Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。
NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈
NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。
Arm与NVIDIA联手推出RTX Spark:统一内存架构重塑Agentic PC生态,合围x86阵营
Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台,采用统一内存架构,专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力,显著降低token处理成本,标志着PC从应用驱动向Agent驱动的根本转变,并得到微软的全面支持。
AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台
AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。