情报
AI 生成的结构化厂商动态简报
微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化
微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
AMD定义AI网络概念并推出专用AI NIC
AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。
微软与BNY展示AI驱动企业组织架构重塑
微软与BNY合作案例揭示了大型金融机构如何通过‘数字员工’与AI平台重构工作流程与组织形态。BNY建立了覆盖从治理、培训到运营的完整AI体系,其‘钻石型’组织模型预示着AI正从工具演变为核心生产力架构。
Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全
Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
Google揭示AI驱动攻击产业化:从漏洞发现到自主执行
Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。
思科强调边缘AI与零信任网络架构为关键任务基础设施核心
思科在SOF Week活动中,将其网络与安全整合战略聚焦于严苛的战术边缘环境,强调零信任身份网络、边缘AI计算和量子安全通信是支撑未来关键任务系统的基石。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
谷歌发布Gemini CLI DevOps扩展,意图通过AI代理控制云部署流程
谷歌推出Gemini CLI DevOps扩展,允许开发者使用自然语言指令,通过AI代理(支持Gemini CLI、Claude Code、Antigravity)直接完成从代码分析、安全检查到部署至Google Cloud的全过程。该工具旨在弥合本地开发与生产部署之间的效率鸿沟。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。
微软将GPT 5.5 Instant引入M365 Copilot,加速多模型平台化
微软CEO宣布将OpenAI的GPT 5.5 Instant模型引入Microsoft 365 Copilot,以提供更快的响应。此举标志着Copilot已从一个单一模型助手演变为一个支持选择OpenAI、Anthropic等多模型的后端平台,将模型选择权下放至用户和任务层面。
NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性
NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。
思科提出临床数据编织架构,将网络定位为AI代理时代核心基础设施
思科在医疗行业AI应用讨论中,提出“临床数据编织”概念,强调网络正从IT工具演变为支持自主AI代理决策的关键基础设施。核心策略是“将AI带到数据旁”,通过本地化计算和端到端可观测性,确保低延迟与安全,以支撑生产级AI代理的规模化部署。
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点
Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
Cloudflare利用eBPF-LSM实现零日漏洞运行时缓解
Cloudflare披露其应对Linux内核“Copy Fail”零日漏洞的响应流程。核心在于,其未依赖传统补丁,而是通过eBPF-LSM安全模块实施细粒度运行时阻断,同时利用eBPF进行全栈行为检测与依赖关系测绘,实现了无服务中断的快速缓解。