Reports
AI-generated structured vendor updates
亚马逊Bedrock推出高级提示优化与模型迁移工具
亚马逊在Bedrock服务中推出高级提示优化工具,支持用户通过基于指标反馈循环自动优化提示词,并可同时在最多5个模型上进行测试与迁移评估。该工具整合了Lambda函数、LLM-as-a-Judge和自然语言指导等多种评估方法。
英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施
英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。
AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定
AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。
思科开源Foundry安全规范,定义AI代理安全评估系统架构
思科开源了Foundry Security Spec,这是一个用于构建AI代理安全评估系统的开放规范。它定义了8个核心代理角色、130项功能需求及11项不可违背原则,旨在将前沿LLM从演示工具转变为可审计、可验证的生产级安全评估系统。该规范与CodeGuard项目结合,形成从检测到预防的闭环。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
思科AI Defense集成Google ADK,为AI Agent提供运行时安全
思科宣布其AI Defense安全产品与Google Agent Development Kit (ADK) 集成,为基于ADK开发的AI Agent提供从本地开发到Gemini Enterprise Agent Platform部署的端到端运行时保护。该集成通过插件或回调方式嵌入ADK生命周期,在不干扰开发流程的前提下,对模型调用、工具执行等关键节点进行策略监控与执行。
Cloudflare修复QUIC协议CUBIC拥塞控制算法死循环漏洞
Cloudflare发现并修复了其开源QUIC实现quiche中一个关键漏洞,该漏洞源于Linux内核CUBIC拥塞控制算法的优化移植缺陷,导致在特定高丢包场景下连接带宽永久锁定在最低值。
微软与BNY展示AI驱动企业组织架构重塑
微软与BNY合作案例揭示了大型金融机构如何通过‘数字员工’与AI平台重构工作流程与组织形态。BNY建立了覆盖从治理、培训到运营的完整AI体系,其‘钻石型’组织模型预示着AI正从工具演变为核心生产力架构。
Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全
Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。
微软Copilot Studio更新:强化AI Agent治理与智能工作流
微软在Copilot Studio中推出多项更新,重点强化AI Agent的集中治理、成本可见性及智能工作流能力。通过Agent 365控制平面、工作流内嵌Agent节点及业务应用集成,旨在将孤立的自动化转变为可信、可扩展的智能系统。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
Google揭示AI驱动攻击产业化:从漏洞发现到自主执行
Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。
谷歌发布Gemini CLI DevOps扩展,意图通过AI代理控制云部署流程
谷歌推出Gemini CLI DevOps扩展,允许开发者使用自然语言指令,通过AI代理(支持Gemini CLI、Claude Code、Antigravity)直接完成从代码分析、安全检查到部署至Google Cloud的全过程。该工具旨在弥合本地开发与生产部署之间的效率鸿沟。
NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性
NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
Cloudflare利用eBPF-LSM实现零日漏洞运行时缓解
Cloudflare披露其应对Linux内核“Copy Fail”零日漏洞的响应流程。核心在于,其未依赖传统补丁,而是通过eBPF-LSM安全模块实施细粒度运行时阻断,同时利用eBPF进行全栈行为检测与依赖关系测绘,实现了无服务中断的快速缓解。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。