情报
AI 生成的结构化厂商动态简报
Cloudflare 三连补丁破解 ClickHouse 分区膨胀锁竞争瓶颈
Cloudflare 在计费管道中遭遇 ClickHouse 性能骤降,根源是分区键改为 (namespace, day) 后,数据部分数量激增导致全局互斥锁争用。他们通过共享锁、延迟复制向量和二分查找三个补丁,将查询延迟降低 50% 以上,并最终解耦了查询耗时与分区数量的关联。
思科用LLM宪法定义取代人工标注,锁定AI安全分类控制权
思科发布Single-Source Safety Definitions,用300+行宪法文档和LLM作为核心评估器,实现AI安全分类一致性。该方法将人工标注压缩为AI驱动,引入意图/内容双轴评估,减少LLM分歧达57倍,并作为Cisco AI Defense产品组合的默认安全分类法。
思科与AMD联合基准测试:将AI网络控制点从GPU移至智能网卡与交换机
思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试,展示在incast拥塞下P01/P99带宽均接近400Gbps线速,证明其架构能消除GPU空转,实现确定性性能。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
CISA Agentic AI安全指南深度分析
本文深度解读CISA发布的Agentic AI安全框架四大核心领域:攻击面与风险管理、身份与权限治理、行为监督与透明度、供应链安全。分析其对企业安全架构的影响,提供三阶段可操作落地路径,并评估Palo Alto Networks、CrowdStrike、Microsoft等厂商的受益程度与市场机会。
Cloudflare Dynamic Workflows:动态路由控制多租户持久执行,锁定平台生态
Cloudflare发布Dynamic Workflows库,基于Dynamic Workers原语,实现运行时动态加载每个租户的工作流代码。Worker Loader路由请求,Workflows引擎持久执行,隔离、零空闲成本。为多租户SaaS、AI agent和CI/CD提供新范式,但隐性锁定平台运行时。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
微软发布托管AI Agent基础设施,将AI Agent视为独立计算实体
微软通过Foundry平台推出“托管代理(Hosted agents)”,为每个AI Agent提供独立、隔离的企业级沙盒环境,包含持久化状态、内置身份与治理。此举旨在将AI Agent的运行时基础设施标准化,降低企业部署门槛,但评论指出此举将控制点从应用层转移至基础设施层。
思科发布AI Agent安全扫描器,将安全控制点前移至IDE
思科发布针对集成开发环境(IDE)的AI Agent安全扫描器扩展,旨在识别和防范AI开发工具链中的新攻击面。该工具通过静态扫描MCP服务器配置、Agent技能定义,并结合代码生成时安全规则引导和运行时文件完整性监控,为开发者提供本地化、多层次的AI Agent安全防护。
Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态
Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。
思科携手英伟达,将网络升级为AI媒体处理的控制平面
思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。