为什么Amazon的这项动态对企业重要？

1. **控制平面转移**：AWS通过Bedrock的Responses API和推理引擎，夺取了模型调用的控制权。用户不再直接调用OpenAI API，而是通过AWS的网关，这意味着AWS可以施加数据驻留、安全策略、配额管理，并收取中间费用。这实质上是**合围微软Azure**——此前OpenAI模型主要在Azure上，现在AWS打破了独家，但同时也将用户锁定在AWS网络内。 2. **隐性锁定开发者**：Codex与AWS SDK深度集成，配置中直接使用`AWS_BEARER_TOKEN_BEDROCK`，鼓励开发者使用AWS凭证。一旦开发者习惯通过Bedrock调用Codex，迁移到其他云的成本极高，包括重新配置认证、工具链、以及可能的数据传输费用。 3. **故意隐瞒的物理限制**：文本承认延迟受多种因素影响，但未量化。**Bedrock的推理引擎**在处理高并发时采用排队机制而非拒绝，这可能导致**尾部延迟**飙升，尤其在大模型推理场景下。此外，区域限制（仅两个美国区域）对于全球部署的企业是严重瓶颈，而AWS未承诺全球扩展时间表。用户可能面临**供应商锁定**和**性能不确定性**的双重风险。

这项动态的影响程度如何？

该情报被评估为对企业具有重大影响，建议技术决策者关注。

Amazon 2026-06-02

Industry Signal 影响: Major 置信: 95%

AWS托管OpenAI GPT-5.5/Codex：控制层从模型转向云平台

内容摘要

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理，通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施，实现数据驻留与容量管理，但用户被锁定在Bedrock生态中。

核心要点

AWS在Amazon Bedrock上提供OpenAI GPT-5.5、GPT-5.4和Codex。GPT-5.5面向最复杂工作负载，GPT-5.4注重性价比。用户通过Responses API调用，该API运行在Bedrock的下一代推理引擎上。Codex是编码代理，支持Codex CLI、Codex App及VS Code、JetBrains、Xcode集成。所有推理路由至Bedrock。认证支持Bedrock API密钥或AWS SDK凭证链。配置示例显示模型ID为openai.gpt-5.5，区域可选。注意：延迟受推理努力、输出长度、区域、配额、缓存等影响。缩放时优先维持稳态负载，高峰时请求排队而非拒绝。目前仅在US East (Ohio)和US West (Oregon)可用。

重要性说明

控制平面转移：AWS通过Bedrock的Responses API和推理引擎，夺取了模型调用的控制权。用户不再直接调用OpenAI API，而是通过AWS的网关，这意味着AWS可以施加数据驻留、安全策略、配额管理，并收取中间费用。这实质上是合围微软Azure——此前OpenAI模型主要在Azure上，现在AWS打破了独家，但同时也将用户锁定在AWS网络内。
隐性锁定开发者：Codex与AWS SDK深度集成，配置中直接使用AWS_BEARER_TOKEN_BEDROCK，鼓励开发者使用AWS凭证。一旦开发者习惯通过Bedrock调用Codex，迁移到其他云的成本极高，包括重新配置认证、工具链、以及可能的数据传输费用。
故意隐瞒的物理限制：文本承认延迟受多种因素影响，但未量化。Bedrock的推理引擎在处理高并发时采用排队机制而非拒绝，这可能导致尾部延迟飙升，尤其在大模型推理场景下。此外，区域限制（仅两个美国区域）对于全球部署的企业是严重瓶颈，而AWS未承诺全球扩展时间表。用户可能面临供应商锁定和性能不确定性的双重风险。

PRO 决策建议

【厂商】竞争对手（如Google Cloud、Microsoft Azure、Snowflake等）应抓住AWS的区域限制和排队机制弱点，推广自己的多区域、低延迟AI推理方案。例如，Azure仍可强调其与OpenAI的深度原生集成（非通过中间层），而Google Cloud可突出其TPU v5p和全球网络优势。同时，提供开源模型（如Llama 3）的托管服务，避免单一供应商锁定。
【企业】CIO和架构师应立即进行零信任技术审计：评估通过Bedrock调用OpenAI模型是否满足数据主权要求（当前仅两个美国区域）；测试高并发下的尾部延迟表现；对比直接使用OpenAI API的成本与灵活性。避免将关键开发工作流（Codex）完全绑定到AWS凭证链，应保留备用方案（如直接OpenAI API或本地部署）。
【投资者】看穿此公告的实质：AWS正在将AI模型商品化并作为基础设施附加服务，长期将侵蚀OpenAI的API收入份额（因为AWS会抽取中间利润）。投资者应关注云基础设施提供商在AI推理中的定价权，以及模型提供商被迫多云化后的利润率变化。对OpenAI而言，多云合作是双刃剑：扩大覆盖但降低议价能力。

来源： Amazon Press Center

查看原文 →

觉得这篇分析有用？

每周收到3-5条AI基础设施关键信号 →

内容摘要

核心要点

重要性说明

PRO 决策建议

觉得这篇分析有用？

💬 评论 (0)