情报
AI 生成的结构化厂商动态简报
AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台,争夺 AI 推理控制权
AWS 发布 Bedrock 新控制台,基于 bedrock-mantle 端点,原生支持 OpenAI 和 Anthropic API 协议,允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化,旨在通过统一推理平面锁定用户工作流,削弱单一模型提供商的 API 壁垒。
NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈
NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。
AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台
AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。
Cisco Scale-Across架构:硅光融合定义AI跨数据中心网络新标准
Cisco发布Scale-Across方案,基于Silicon One P200路由系统(51.2Tbps)和400G/800G ZR/ZR+相干光模块,结合开放线路系统,旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题,实现类似单机房的低延迟无损连接。
BadHost漏洞暴露Starlette认证绕过,全球AI Agent基础设施面临HTTP走私风险
BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致,通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库,使SSE/HTTP传输模式的AI Agent服务器直接暴露,可导致数据泄露乃至RCE。
Anthropic与Cloudflare联手解耦AI代理:推理与执行分离成新范式
Anthropic与Cloudflare推出集成,允许Claude Managed Agents在Cloudflare沙箱中执行代码,实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制,支持微VM或轻量级V8 isolate环境,并内置浏览器、电子邮件等工具。
NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷:从驱动层到硬件层的安全范式必须重构
Pwn2Own Berlin 2026上,NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用,实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核,彻底打破当前依赖驱动隔离的GPU共享模型,迫使行业重新评估AI基础设施安全架构。
思科Unified Edge平台:服务商边缘AI服务的新生态捆绑
思科推出Cisco Unified Edge平台,整合计算、网络、存储和安全,通过Intersight集中管理,面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户,计划将边缘能力捆绑进企业连接服务。
AWS AgentCore自主支付:AI代理的货币化控制点与安全风险双重升级
AWS在Bedrock AgentCore中预览了托管支付能力,允许AI代理自主支付API、MCP服务器等费用,与Coinbase和Stripe集成。同时推出Agent Toolkit for AWS和MCP Server GA,强化代理开发与安全控制。此举将AI代理从辅助工具推向自主执行实体,但引入新的安全与锁定风险。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。
AWS将虚拟桌面升级为AI Agent基础设施层
AWS宣布Amazon WorkSpaces支持AI Agent以独立身份和权限直接操作桌面应用,无需API或应用改造。此举将虚拟桌面从人员生产力工具扩展为企业AI Agent的通用运行平台,通过标准MCP协议与主流Agent框架集成。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
Claude 4.6全面登陆AWS Bedrock:Anthropic多平台分发战略深化
Claude Sonnet 4.6于2026年2月17日正式登陆AWS Bedrock,支持30+全球区域部署。该模型在编程、Agent工作流和多步编排方面达到前沿性能,成本接近Claude Sonnet 4.5。Claude Opus 4.6和Claude Sonnet 4.6双版本同时可用,标志Anthropic正式形成「直接API+云厂商嵌入」的多元分发架构。
微软发布AI时代网络安全责任框架,强调公私协作与漏洞管理现代化
微软发布了一份关于利用下一代AI加强全球数字生态安全的框架性文件,核心观点是AI加速漏洞发现的同时,必须同步强化响应与修复能力。文件提出了五项具体建议,强调公私协作、负责任的AI能力发布以及现代化漏洞管理流程。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
思科发布AI模型溯源宪法,定义权重级衍生关系标准
思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。