AWS - AI基础设施情报搜索

Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台，争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台，基于 bedrock-mantle 端点，原生支持 OpenAI 和 Anthropic API 协议，允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化，旨在通过统一推理平面锁定用户工作流，削弱单一模型提供商的 API 壁垒。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例，联合 Revolut、Mastercard 等金融机构，推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架，将金融数据处理从特征工程转向统一嵌入，实质是控制层向 NVIDIA 硬件生态转移。

Amazon 其他 2026-06-02

AWS托管OpenAI GPT-5.5/Codex：控制层从模型转向云平台

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理，通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施，实现数据驻留与容量管理，但用户被锁定在Bedrock生态中。

Cisco 其他 2026-05-28

Cisco Scale-Across架构：硅光融合定义AI跨数据中心网络新标准

Cisco发布Scale-Across方案，基于Silicon One P200路由系统（51.2Tbps）和400G/800G ZR/ZR+相干光模块，结合开放线路系统，旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题，实现类似单机房的低延迟无损连接。

Other 其他 2026-05-22

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险

BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致，通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库，使SSE/HTTP传输模式的AI Agent服务器直接暴露，可导致数据泄露乃至RCE。

Cloudflare 其他 2026-05-19

Anthropic与Cloudflare联手解耦AI代理：推理与执行分离成新范式

Anthropic与Cloudflare推出集成，允许Claude Managed Agents在Cloudflare沙箱中执行代码，实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制，支持微VM或轻量级V8 isolate环境，并内置浏览器、电子邮件等工具。

NVIDIA 其他 2026-05-16

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷：从驱动层到硬件层的安全范式必须重构

Pwn2Own Berlin 2026上，NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用，实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核，彻底打破当前依赖驱动隔离的GPU共享模型，迫使行业重新评估AI基础设施安全架构。

Cisco 其他 2026-05-14

思科Unified Edge平台：服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台，整合计算、网络、存储和安全，通过Intersight集中管理，面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户，计划将边缘能力捆绑进企业连接服务。

Amazon 其他 2026-05-12

AWS AgentCore自主支付：AI代理的货币化控制点与安全风险双重升级

AWS在Bedrock AgentCore中预览了托管支付能力，允许AI代理自主支付API、MCP服务器等费用，与Coinbase和Stripe集成。同时推出Agent Toolkit for AWS和MCP Server GA，强化代理开发与安全控制。此举将AI代理从辅助工具推向自主执行实体，但引入新的安全与锁定风险。

ARM 其他强信号 2026-05-07

Arm发布创纪录财报，AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩，年收入达49.2亿美元，连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU，其数据中心市场获得超20亿美元客户需求，并获Meta、AWS、Google等巨头支持。

AMD 其他中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试，强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试，强调在AI时代，开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件，并加强了对裸金属云环境和并行计算的支持。

Amazon 其他强信号 2026-05-06

AWS发布托管MCP服务器，为AI代理提供安全AWS API接入

AWS宣布其托管Model Context Protocol（MCP）服务器正式可用，为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档，并引入沙箱脚本执行和技能指导，旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。

Anthropic 其他强信号 2026-05-06

Anthropic与SpaceX达成算力协议，大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议，将使用其Colossus 1数据中心全部算力，获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力，并已立即提高Claude Code和API的使用限制。

Amazon 其他强信号 2026-05-06

AWS将虚拟桌面升级为AI Agent基础设施层

AWS宣布Amazon WorkSpaces支持AI Agent以独立身份和权限直接操作桌面应用，无需API或应用改造。此举将虚拟桌面从人员生产力工具扩展为企业AI Agent的通用运行平台，通过标准MCP协议与主流Agent框架集成。

Cisco 其他强信号 2026-05-05

思科发布Nexus Dashboard 4.2，强化AI工作负载的网络监控与安全

思科发布数据中心管理平台Nexus Dashboard 4.2，核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由，以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。

Anthropic 技术更新强信号 2026-05-02

Claude 4.6全面登陆AWS Bedrock：Anthropic多平台分发战略深化

Claude Sonnet 4.6于2026年2月17日正式登陆AWS Bedrock，支持30+全球区域部署。该模型在编程、Agent工作流和多步编排方面达到前沿性能，成本接近Claude Sonnet 4.5。Claude Opus 4.6和Claude Sonnet 4.6双版本同时可用，标志Anthropic正式形成「直接API+云厂商嵌入」的多元分发架构。

Microsoft 其他强信号 2026-05-01

微软发布AI时代网络安全责任框架，强调公私协作与漏洞管理现代化

微软发布了一份关于利用下一代AI加强全球数字生态安全的框架性文件，核心观点是AI加速漏洞发现的同时，必须同步强化响应与修复能力。文件提出了五项具体建议，强调公私协作、负责任的AI能力发布以及现代化漏洞管理流程。

NVIDIA 其他强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作，推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现，整合OpenShell安全运行时与Nemotron开源模型，为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战，将AI基础设施控制点向本地、安全、可审计的架构迁移。

Cisco 其他强信号 2026-04-30

思科发布液冷网络交换机，将液冷架构扩展至AI基础设施核心

思科正式发布采用直接芯片液冷设计的N9000与8000系统，将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍，能耗降低近70%，旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。