C
Cloudflare
2026-05-18
Technology Integration 影响: Major 置信: 85%

Cloudflare实测Anthropic Mythos:AI漏洞链构建与自动验证突破

内容摘要

Cloudflare在Project Glasswing中测试了Anthropic的Mythos Preview模型,发现其能自动将多个低严重性漏洞链成可利用的PoC,并生成可运行的代码。同时,他们构建了多阶段harness以解决噪声和上下文限制,显著提升漏洞发现质量。

核心要点

Cloudflare在Project Glasswing中深度测试了Anthropic的Mythos Preview模型,该模型专为安全漏洞研究设计。与通用前沿模型相比,Mythos Preview的两项核心能力实现质变:Exploit chain construction——它能够将多个攻击原语(如use-after-freearbitrary read/write)自动组合成完整的利用链,推理过程类似资深安全研究员;Proof generation——模型能编写、编译并运行触发漏洞的代码,通过失败反馈循环自动调整假设,生成可工作的PoC

Cloudflare发现,模型存在有机的refusal行为,但一致性差,相同请求在不同上下文可能得到截然不同的结果,因此不能依赖其作为安全边界。信号噪声问题依然突出:C/C++代码产生更多误报;模型存在bias,倾向于过度报告“可能”的漏洞。但Mythos Preview的输出质量明显更高,附带的PoC减少了“是否真实”的疑问。

为了规模化应用,Cloudflare放弃了使用通用coding agent直接扫描仓库的方式,转而构建了专门的harness,包含ReconHunt(并行50个agent)、Validate(对抗性审查)、GapfillDedupeTrace(跨仓库符号索引判断可达性)、FeedbackReport等阶段。该harness将任务拆解为窄范围、并行的子任务,显著提升了覆盖率和准确性。

重要性说明

表面看是AI安全工具的进步,但Cloudflare的harness架构暗藏三重隐性控制意图:

  • 防守合围传统安全厂商:通过将AI漏洞发现与自身CDN/边缘基础设施深度绑定(如Trace阶段利用跨仓库符号索引),Cloudflare将安全能力内化为平台服务,迫使CrowdStrike、Palo Alto等传统安全厂商要么自建类似AI管道,要么在边缘安全市场失去竞争力。
  • 锁定用户资产:harness的ReconHunt阶段依赖对仓库架构的深度解析,一旦用户采用该管道,其代码库的信任边界、入口点等元数据将被Cloudflare掌握,形成迁移壁垒。用户若想切换安全供应商,需重建整套上下文,成本极高。
  • 故意隐瞒的工程短板:原文未提Mythos Preview的推理时延和成本。多agent并行(50个Hunt agent)意味着显著的GPU/TPU算力消耗,且Trace阶段需要跨仓库符号索引,在大型企业(数千仓库)中会产生指数级组合爆炸。另外,模型refusal的不一致性可能引发合规审计风险——同一漏洞在不同时间或上下文可能被拒绝报告,导致安全盲区。

PRO 决策建议

【Vendors】竞争对手(如AkamaiFastlyCrowdStrike)应迅速推出类似AI漏洞发现服务,并强调跨平台中立性——指出Cloudflare的harness与自身CDN深度耦合,用户若使用将被锁定在Cloudflare生态。同时,开发开源替代harness(如基于LangChain的通用管道),降低用户迁移成本。
【Enterprises】企业CIO和架构师应进行零信任技术审计:要求Cloudflare提供harness的数据保留策略代码元数据使用声明,确保仓库架构信息不被用于其他商业目的。同时,评估Mythos Preview的refusal不一致性对合规的影响,建立人工复核流程覆盖模型拒绝报告的漏洞。考虑采用多模型并行扫描(如同时使用OpenAI、Google的模型)以分散供应商集中度风险。
【Investors】投资者应看穿公关辞令:Cloudflare的Project Glasswing本质是边缘安全护城河的加固,而非纯粹的AI突破。关注其GPU算力成本模型推理延迟对利润率的长期侵蚀。同时,警惕Anthropic等模型供应商可能直接推出类似安全服务,绕开Cloudflare成为直接竞争对手。

来源: blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)