C
Cloudflare
2026-06-22
Platform Launch 影响: Major 置信: 92%

Cloudflare AI网关2.0:边缘控制平面夺取AI推理路由与安全主导权

内容摘要

Cloudflare推出AI Gateway 2.0,通过智能路由跨越50+模型提供商,宣称降低成本30%;同时推出Workers AI边缘推理(延迟<10ms),与NVIDIA合作部署GPU加速服务,并扩展AI防火墙。此举将AI流量控制平面从云巨头转移至边缘网络。

核心要点

Cloudflare正式发布AI Gateway 2.0,这是一套位于其全球边缘网络(覆盖330+城市,总容量超300Tbps)的智能路由层,可动态分发AI推理请求至超过50家模型提供商(包括OpenAIAnthropicGoogle),并宣称能降低推理成本超过30%。该网关内置AI防火墙,可实时检测并阻断提示词注入攻击、模型窃取等AI特定威胁,将安全策略执行点从模型端前移至网络边缘。

同步推出的Workers AI平台允许开发者在Cloudflare边缘节点上直接部署和运行模型,实现低至10毫秒的推理延迟。Cloudflare还宣布与NVIDIA合作,在其边缘网络内部署GPU加速推理服务,暗示将利用NVIDIA的硬件能力处理更复杂的模型。此外,R2存储服务新增针对AI训练数据集的优化支持,形成从存储到推理的闭环。新版AI SDK则旨在降低边缘AI的部署门槛。

重要性说明

Cloudflare此举本质是在【夺取AI推理的控制平面】。它通过AI Gateway 2.0成为所有模型流量的中间人,将路由决策、成本优化和安全策略从模型提供商(如OpenAI)手中剥离,转移至自己的边缘网络。这是在【合围AWS、Azure和Google Cloud】——这些云巨头正试图通过自家AI服务(如Amazon Bedrock、Azure OpenAI)锁定用户,而Cloudflare的网关则成为跨云、跨模型的统一入口,剥夺了云厂商的流量控制权和数据面可见性。

然而,Cloudflare刻意淡化了【边缘推理的物理限制】。其宣称的10毫秒延迟仅适用于极轻量模型(如小语言模型或分类器),对于当前主流的大语言模型(LLM) 如GPT-4或Claude 3,边缘节点的GPU算力密度显存带宽远不及云数据中心,根本无法承载全尺寸模型推理。这意味着Workers AI的实际应用场景被严重局限,用户若想获得高质量推理,最终仍需回源至云提供商,而Cloudflare则通过路由层攫取流量税。此外,该架构引入了新的单点故障:所有AI流量必须经过Cloudflare的网关,其BGP路由策略Anycast网络的稳定性将直接决定企业AI服务的可用性,这构成了一种隐性的网络锁定

PRO 决策建议

【厂商:Akamai、Fastly、AWS、Azure、GCP】
立即推出竞争性AI网关或边缘推理服务。Akamai和Fastly应加速与Hugging FaceReplicate等模型社区整合,提供类似的多提供商路由能力,并强调自身边缘节点的地理覆盖优势。AWS、Azure和GCP必须强化其AI服务的深度集成优势,例如通过VPC端点Direct Connect提供更低延迟、更安全的路由,同时公开基准测试以揭露Cloudflare边缘推理的算力短板。

【企业:CIO与架构师】
进行零信任技术审计:切勿将Cloudflare AI Gateway视为万能解决方案。立即对Workers AI进行压力测试,验证其是否能承载你的核心LLM推理负载(如RAG代码生成)。要求Cloudflare提供SLA,明确边缘GPU的可用性吞吐量。评估供应商锁定风险:若所有AI流量都经过Cloudflare,迁移成本将极高。考虑采用多网关策略,预留与云厂商直接集成的备用路由。

【投资者】
看穿公关辞令:Cloudflare的AI故事核心是流量聚合,而非算力突破。其长期价值在于成为AI时代的CDN,而非AI云。关注其AI Gateway的采用率每请求收入指标,而非边缘推理的GPU部署数量。警惕其与NVIDIA合作带来的资本支出压力,以及边缘GPU折旧速度。

来源: Cloudflare Blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)