情报
AI 生成的结构化厂商动态简报
思科强调边缘AI与零信任网络架构为关键任务基础设施核心
思科在SOF Week活动中,将其网络与安全整合战略聚焦于严苛的战术边缘环境,强调零信任身份网络、边缘AI计算和量子安全通信是支撑未来关键任务系统的基石。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
谷歌发布Gemini CLI DevOps扩展,意图通过AI代理控制云部署流程
谷歌推出Gemini CLI DevOps扩展,允许开发者使用自然语言指令,通过AI代理(支持Gemini CLI、Claude Code、Antigravity)直接完成从代码分析、安全检查到部署至Google Cloud的全过程。该工具旨在弥合本地开发与生产部署之间的效率鸿沟。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
Cloudflare为AI Agent时代重组裁员,重塑内部运营模式
Cloudflare宣布全球裁员超1100人,核心原因是其内部AI使用量在过去三个月激增600%,数千名员工每日依赖AI Agent完成工作。公司决定彻底重塑内部流程、团队和角色,以适应并引领Agentic AI时代,而非进行成本削减。
微软将GPT 5.5 Instant引入M365 Copilot,加速多模型平台化
微软CEO宣布将OpenAI的GPT 5.5 Instant模型引入Microsoft 365 Copilot,以提供更快的响应。此举标志着Copilot已从一个单一模型助手演变为一个支持选择OpenAI、Anthropic等多模型的后端平台,将模型选择权下放至用户和任务层面。
NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性
NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。
思科提出临床数据编织架构,将网络定位为AI代理时代核心基础设施
思科在医疗行业AI应用讨论中,提出“临床数据编织”概念,强调网络正从IT工具演变为支持自主AI代理决策的关键基础设施。核心策略是“将AI带到数据旁”,通过本地化计算和端到端可观测性,确保低延迟与安全,以支撑生产级AI代理的规模化部署。
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
Cloudflare利用eBPF-LSM实现零日漏洞运行时缓解
Cloudflare披露其应对Linux内核“Copy Fail”零日漏洞的响应流程。核心在于,其未依赖传统补丁,而是通过eBPF-LSM安全模块实施细粒度运行时阻断,同时利用eBPF进行全栈行为检测与依赖关系测绘,实现了无服务中断的快速缓解。
Cloudflare宣布裁员重组,转向AI Agent优先运营模式
Cloudflare在发布2026年Q1财报的同时,宣布将裁员约1100人并进行组织重组,旨在加速向“AI Agent优先”的运营模式转型。公司CEO称AI正在重塑互联网和软件范式,并强调自身已成为AI的“最苛刻客户”。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
思科联合Ciena发布研究报告:AI驱动运营商网络向自主化演进
思科与Ciena委托Omdia发布白皮书,基于对80家全球运营商的调研,揭示了AI在传输网络中的核心应用趋势。报告指出,为应对AI带来的流量与复杂性激增,运营商正加速从手动运维向基于AI代理与数字孪生的自主网络演进,未来三年过半网络将实现自主或半自主运行。
微软通过Hackathon模式将AI洞察转化为垂直行业SaaS解决方案
微软车库项目RushReady展示了其通过与Ecolab合作,利用餐厅运营数据和AI模型为快餐店经理提供实时决策指导的SaaS产品。该项目证明了微软从内部创新到行业解决方案的商业化路径,并强调了针对特定场景、可自适应学习的数据模型的重要性。
HPE发布全自主网络能力,宣称实现无需人工干预的实时问题检测与修复
HPE宣布推出新的“自驾驶网络”能力,通过微服务、自主代理和高级代理网格架构,实现网络问题的实时检测、诊断和修复,无需人工干预。该能力集成于HPE Mist和Aruba Central平台,标志着从洞察驱动运营向真正自主运营的转变。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
思科研究揭示VLM双重失效模式,暴露AI安全表征层脆弱性
思科AI安全团队研究发现,通过对图像进行微小、有界的像素扰动,可绕过视觉语言模型的安全对齐,揭示出‘可读性恢复’与‘拒绝抑制’两种共存的失效模式。这表明攻击可在不依赖目标模型内部信息的情况下,利用多模态嵌入距离作为攻击指标,暴露了当前基于像素域或OCR过滤的防御机制的局限性。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。