Filter

×
当前筛选 清除全部
关键词: GPU ×
159 情报总数
1/8 当前页
Intel Other 中信号 2026-05-16

AI Agent工作负载推动服务器CPU结构性短缺,Arm需求超200亿美元重塑价值链

AI基础设施瓶颈从GPU向CPU转移。Agentic AI推动CPU-GPU配比从1:8向1:1演进。AMD EPYC交付8-12周份额46.2%,Intel部分Xeon配置交付6个月,Arm 3nm 136核AGI处理器需求超200亿美元。CPU成为新瓶颈资源。

NVIDIA Other 强信号 2026-05-16

NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷

Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。

Cisco Other 强信号 2026-05-14

思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位

思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。

Microsoft Other 强信号 2026-05-14

微软通过驱动程序质量倡议强化Windows平台控制

微软在WinHEC 2026上推出驱动程序质量倡议,旨在通过四大支柱——架构、信任、生命周期和度量——系统性提升驱动程序的可靠性、安全性和性能。此举标志着微软正加强对Windows硬件生态系统的技术规范与控制,以提升最终用户体验。

Cisco Other 强信号 2026-05-13

思科在ONUG 2026提出AI数据中心网络与安全融合架构

思科在ONUG 2026峰会上,围绕AI Agentic时代的数据中心,系统阐述了其融合网络与安全的AI原生基础设施蓝图。其核心是通过将安全策略(如防火墙、微分段)卸载至DPU,并利用AI驱动的运维模型,解决AI工作负载对网络性能与安全隔离的双重苛刻需求。

NVIDIA Other 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

Cisco Other 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

AMD Other 中信号 2026-05-12

AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定

AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。

Google Other 强信号 2026-05-12

Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升

Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。

Microsoft Other 强信号 2026-05-12

微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化

微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。

AMD Other 强信号 2026-05-12

AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署

AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。

AMD Other 强信号 2026-05-12

AMD定义AI网络概念并推出专用AI NIC

AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。

Fortinet Other 强信号 2026-05-12

Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全

Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。

AMD Other 强信号 2026-05-08

AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比

AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。

NVIDIA Other 强信号 2026-05-08

NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战

NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。

NVIDIA Other 强信号 2026-05-08

NVIDIA与美能源部深化AI科学合作,推动Genesis使命

NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。

NVIDIA Other 强信号 2026-05-08

NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性

NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。

Cisco Other 强信号 2026-05-07

思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力

思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。

AMD Other 强信号 2026-05-07

AMD提出Agentic AI驱动数据中心CPU与GPU架构分离

AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。

ARM Other 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。