C
Cisco
2026-05-12
Technology Integration 影响: Important 置信: 85%

思科用LLM宪法定义取代人工标注,锁定AI安全分类控制权

内容摘要

思科发布Single-Source Safety Definitions,用300+行宪法文档和LLM作为核心评估器,实现AI安全分类一致性。该方法将人工标注压缩为AI驱动,引入意图/内容双轴评估,减少LLM分歧达57倍,并作为Cisco AI Defense产品组合的默认安全分类法。

核心要点

思科在博客中详细阐述了其基于宪法定义的AI安全分类新方法。核心是Single-Source Safety Definitions:为Cisco AI Security and Safety Framework中的每种技术(如骚扰、仇恨言论、越狱)编写300+行的操作规范文档,包含决策流程图、边界裁定、工作示例和累积的边缘案例决策。

该文档被视为单一真理源,下游所有流程(运行时分类、合成数据生成、标注指南、客户文档、合规映射)均以此为准。运行时,LLM每调用一次就完整重读该文档,而非依赖人类记忆。

双轴评估引入意图(Intent)内容(Content),覆盖整个对话。实验显示,在WildChat上,两个前沿LLM使用段落级定义时每千条对话分歧达66条;使用宪法后降至3条以下(57倍改进)。在HarmBench上,三个LLM使用宪法达成一致标签的频率高于三名人。

思科强调,人类失败源于工作记忆超载(300+行文档)和多重技术分类折叠;LLM通过逐条重读和独立判断避免这些问题。残留分歧直接指向宪法中的模糊句,通过补丁迭代解决。

重要性说明

思科此举表面是提升标注一致性,实则是将安全分类的控制平面从人类转移到AI,并利用宪法文档锁定用户对Cisco AI Defense的依赖。

防守/合围谁? 直接针对传统内容安全厂商(如Palo Alto Networks、Zscaler)和依赖人工标注的AI安全初创公司。通过将宪法定义与Cisco专有框架绑定,迫使客户采用Cisco的评估体系,否则无法获得一致的分类解释。

隐性锁定用户资产: 宪法文档本身虽是可读文本,但评估过程依赖Cisco指定的LLM(如GPT-5.4、Opus 4.6)。用户一旦采用,就会陷入模型依赖陷阱:未来若需更换LLM,必须重新验证宪法一致性,成本高昂。此外,宪法迭代由Cisco控制,用户无法自主修改核心定义。

故意隐瞒的工程短板: 每次分类都重读300+行文档,推理尾部延迟计算成本显著高于传统分类器。在每秒数千次请求的生产环境中,延迟可能成为瓶颈。双轴评估需分析全对话,进一步放大延迟。此外,宪法依赖LLM的指令遵循能力,若模型更新导致行为漂移,分类一致性将崩溃——Cisco未讨论此风险。

PRO 决策建议

【厂商(竞争对手)】
其他安全厂商(如Palo Alto NetworksZscaler)应立即推出开源宪法框架,允许客户自定义分类定义并支持多LLM后端,强调可移植性。同时攻击Cisco方案的延迟陷阱:展示在实时流量过滤场景中,Cisco的LLM重读机制导致吞吐量下降和尾部延迟飙升,而传统轻量分类器(如基于规则或小模型)更高效。

【企业(CIO/架构师)】
对Cisco AI Defense进行零信任技术审计:要求Cisco提供宪法文档的版本控制机制,确保客户能审计每次定义变更。测试模型替换弹性:尝试用开源LLM(如Llama 4)运行同一宪法,观察一致性是否下降。评估延迟影响:在生产环境中测量P99分类延迟,并与现有规则引擎对比。避免将安全分类的“真理源”完全交予单一厂商。

【投资者】
看穿Cisco此动作的本质:这是通过控制定义层来提升AI Defense产品粘性,而非真正的技术突破。关注竞争对手(如Anthropic的Constitutional Classifiers)是否提供更开放的方案。Cisco依赖第三方LLM(OpenAI、Anthropic、Google),其安全分类质量受制于模型供应商,存在供应商集中度风险。长期看,开源宪法运动可能削弱Cisco的锁定效应。

来源: Cisco Blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)