情报
AI 生成的结构化厂商动态简报
AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权
AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。
思科Agent Gateway:零信任从访问控制升级为AI代理行动控制
思科发布Secure Access Agent Gateway,将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份,在LLM、MCP工具、SaaS API等交互点实施策略,实现行动级审计和凭证注入,旨在解决代理自主行动带来的新安全风险。
思科Cloud Control+AI Canvas:用40年数据铸就AgenticOps,控制点从硬件转向AI决策平面
思科在Cisco Live 2026发布Cloud Control统一管控平台与AI Canvas协同环境,基于Splunk数据底座和专用目的模型,实现AgenticOps运维模式。同时,Silicon One架构统一园区与云交换机,并推出量子安全推送服务。此举标志着思科从网络设备商向AI基础设施运维平台的战略转型,核心控制点转移至AI智能体决策层。
AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台
AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。
NVIDIA FOX蓝图:工厂控制层从PLC转向AI代理,锁定DGX硬件
NVIDIA发布Factory Operations Blueprint (FOX),基于NemoClaw和DGX Station (GB300 Grace Blackwell Ultra Desktop Superchip)构建自主工厂管理代理,整合机器信号、质量系统与机器人车队,实现全厂智能决策。富士康、和硕、研华、纬创已部署,预计根因分析效率提升80%,劳动生产力提升15%。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
Cloudflare Dynamic Workflows:动态路由控制多租户持久执行,锁定平台生态
Cloudflare发布Dynamic Workflows库,基于Dynamic Workers原语,实现运行时动态加载每个租户的工作流代码。Worker Loader路由请求,Workflows引擎持久执行,隔离、零空闲成本。为多租户SaaS、AI agent和CI/CD提供新范式,但隐性锁定平台运行时。
AWS将AI Agent平台化,并深化与OpenAI的云集成
AWS在年度活动上宣布将AI Agent能力全面产品化,推出面向工作的个人AI助手Amazon Quick,并将Amazon Connect扩展为四个垂直领域的Agentic AI解决方案。同时,AWS与OpenAI扩大合作,将最新模型、Codex及托管代理服务深度集成至Amazon Bedrock平台。
英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层
英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。
英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代
英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命
NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。
NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命
NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。调试效率从天级压缩至小时级,代码库探索从周级压缩至隔夜完成。黄仁勋向全体员工发送邮件鼓励使用:"让我们跃进光速。欢迎来到AI时代。"双方合作始于2016年DGX-1交付。
思科发布AI Agent安全扫描器,将安全控制点前移至IDE
思科发布针对集成开发环境(IDE)的AI Agent安全扫描器扩展,旨在识别和防范AI开发工具链中的新攻击面。该工具通过静态扫描MCP服务器配置、Agent技能定义,并结合代码生成时安全规则引导和运行时文件完整性监控,为开发者提供本地化、多层次的AI Agent安全防护。
Cloudflare扩展Agent Cloud,为下一代AI Agent构建基础设施平台
Cloudflare宣布扩展其Agent Cloud平台,推出动态Workers、Git兼容存储、沙盒环境及持久化框架,旨在为大规模、长周期运行的AI Agent提供安全、高效且可负担的基础设施。此举标志着Cloudflare正从边缘网络服务商向AI原生应用基础设施提供商转型。
OpenAI 融资1220亿美元加速全球AI基础设施建设
OpenAI宣布获得1220亿美元融资,将用于扩展全球前沿AI能力、投资下一代计算基础设施,并满足ChatGPT、Codex和企业级AI的快速增长需求。这笔创纪录融资将显著提升其AI训练集群和推理基础设施的建设规模。
思科开源AI Agent安全治理工具DefenseClaw
思科推出开源工具DefenseClaw,为OpenClaw等AI Agent提供三层安全防护架构:供应链扫描、运行时检测和系统边界控制。该方案整合了NVIDIA的OpenShell沙箱技术,实现从安装到运行的全周期自动化安全治理。