A
Amazon
2026-06-02
Industry Signal 影响: Major 置信: 95%

AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台

内容摘要

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。

核心要点

AWS在Amazon Bedrock上提供OpenAI GPT-5.5GPT-5.4Codex。GPT-5.5面向最复杂工作负载,GPT-5.4注重性价比。用户通过Responses API调用,该API运行在Bedrock的下一代推理引擎上。Codex是编码代理,支持Codex CLICodex AppVS CodeJetBrainsXcode集成。所有推理路由至Bedrock。认证支持Bedrock API密钥AWS SDK凭证链。配置示例显示模型ID为openai.gpt-5.5,区域可选。注意:延迟受推理努力、输出长度、区域、配额、缓存等影响。缩放时优先维持稳态负载,高峰时请求排队而非拒绝。目前仅在US East (Ohio)US West (Oregon)可用。

重要性说明

  • 控制平面转移:AWS通过Bedrock的Responses API和推理引擎,夺取了模型调用的控制权。用户不再直接调用OpenAI API,而是通过AWS的网关,这意味着AWS可以施加数据驻留、安全策略、配额管理,并收取中间费用。这实质上是合围微软Azure——此前OpenAI模型主要在Azure上,现在AWS打破了独家,但同时也将用户锁定在AWS网络内。
  • 隐性锁定开发者:Codex与AWS SDK深度集成,配置中直接使用AWS_BEARER_TOKEN_BEDROCK,鼓励开发者使用AWS凭证。一旦开发者习惯通过Bedrock调用Codex,迁移到其他云的成本极高,包括重新配置认证、工具链、以及可能的数据传输费用。
  • 故意隐瞒的物理限制:文本承认延迟受多种因素影响,但未量化。Bedrock的推理引擎在处理高并发时采用排队机制而非拒绝,这可能导致尾部延迟飙升,尤其在大模型推理场景下。此外,区域限制(仅两个美国区域)对于全球部署的企业是严重瓶颈,而AWS未承诺全球扩展时间表。用户可能面临供应商锁定性能不确定性的双重风险。

PRO 决策建议

【厂商】竞争对手(如Google Cloud、Microsoft Azure、Snowflake等)应抓住AWS的区域限制排队机制弱点,推广自己的多区域、低延迟AI推理方案。例如,Azure仍可强调其与OpenAI的深度原生集成(非通过中间层),而Google Cloud可突出其TPU v5p和全球网络优势。同时,提供开源模型(如Llama 3)的托管服务,避免单一供应商锁定。
【企业】CIO和架构师应立即进行零信任技术审计:评估通过Bedrock调用OpenAI模型是否满足数据主权要求(当前仅两个美国区域);测试高并发下的尾部延迟表现;对比直接使用OpenAI API的成本与灵活性。避免将关键开发工作流(Codex)完全绑定到AWS凭证链,应保留备用方案(如直接OpenAI API或本地部署)。
【投资者】看穿此公告的实质:AWS正在将AI模型商品化并作为基础设施附加服务,长期将侵蚀OpenAI的API收入份额(因为AWS会抽取中间利润)。投资者应关注云基础设施提供商在AI推理中的定价权,以及模型提供商被迫多云化后的利润率变化。对OpenAI而言,多云合作是双刃剑:扩大覆盖但降低议价能力。

来源: Amazon Press Center
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)