GPU - AI基础设施情报搜索

Cisco 其他中信号 2026-03-25

思科联合英伟达验证私有AI基础设施快速微调能力

思科IT与英伟达合作，基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据，无需人工标注，使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。

ARM 其他强信号 2026-03-25

ARM推出AGI CPU芯片，进军AI基础设施市场

ARM于2026年3月推出首款自研AGI CPU生产级芯片，标志着从IP授权模式向完整硅解决方案提供商的战略转型。该芯片专为下一代AI基础设施设计，可能重塑数据中心处理器生态格局。

HPE 其他强信号 2026-03-24

HPE推出AI安全架构增强应对AI采用风险

HPE宣布推出SRX400系列防火墙、混合网格安全架构扩展及AI治理能力，旨在帮助企业安全采用AI。新功能包括AI应用可见性、提示级检查和身份基础保护，以应对AI带来的数据暴露风险。

NVIDIA 其他强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配（DRA）驱动捐献给CNCF，使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区，并协同多家云厂商推动标准化。

NVIDIA 其他强信号 2026-03-24

NVIDIA 捐赠 GPU 动态资源分配驱动至 Kubernetes

NVIDIA 将 GPU 动态资源分配驱动程序捐赠给云原生计算基金会，支持 MPS 和 MIG 技术实现 GPU 智能共享与动态重配置。同时为 Kata Containers 引入 GPU 支持增强 AI 工作负载隔离，KAI Scheduler 加入 CNCF 沙盒项目。

ARM 其他强信号 2026-03-24

ARM与NVIDIA推动AI工作站本地化变革

ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列，八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行，第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度，实现云端工具链向边缘端无缝迁移。

Check Point 其他 2026-03-23

Check Point发布AI工厂安全蓝图：借NVIDIA BlueField将控制点下沉至GPU与LLM层

Check Point发布AI工厂安全架构蓝图，与NVIDIA BlueField DPU深度集成，将防火墙和威胁防护嵌入硬件层，覆盖从GPU服务器到LLM提示的四个安全层级。同时推出AI Factory Firewall，实现无CPU/GPU开销的硬件加速安全，旨在锁定AI基础设施安全控制权。

Check Point 其他强信号 2026-03-23

Check Point发布AI工厂安全蓝图覆盖GPU至LLM全栈防护

Check Point推出AI工厂安全架构蓝图，建立从GPU硬件层到LLM提示层的全栈防护体系，通过零信任框架实现AI基础设施纵深防御。

Check Point 其他强信号 2026-03-23

Check Point发布AI工厂安全蓝图，定义分层防护架构

Check Point发布AI工厂安全蓝图，提出从GPU硬件到模型治理的端到端安全框架。该架构将安全措施深度集成到AI开发与运营全生命周期，针对数据投毒、模型窃取等新型风险提供综合防护。

NVIDIA 其他强信号 2026-03-21

NVIDIA Blackwell架构实现25倍能效提升

NVIDIA发布Blackwell GPU架构，通过Transformer引擎和NVLink互联技术创新，实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本，直接影响数据中心TCO和可持续性指标。

NVIDIA 其他强信号 2026-03-21

英伟达CEO阐述加速计算范式，预示AI基础设施架构演进

英伟达CEO黄仁勋接受专访，系统阐述加速计算作为计算机架构根本性转变的理念。他强调数据中心正从通用CPU转向由GPU主导的专用加速平台，并认为未来的计算堆栈将围绕加速计算进行重构。

NVIDIA 其他强信号 2026-03-21

NVIDIA阐述加速计算三阶段演进与软件定义数据中心战略

NVIDIA CEO黄仁勋提出加速计算三阶段演进模型，从单一GPU加速发展到全栈加速，最终进入软件定义、AI驱动的数据中心阶段。公司强调通过软件定义基础设施实现动态资源分配，并重申从芯片到应用的全栈AI解决方案战略。

Cisco 其他强信号 2026-03-20

思科与英伟达合作将防火墙嵌入DPU实现AI服务器安全

思科将其混合网格防火墙扩展至英伟达BlueField DPU，实现400G线速状态化分段安全。该方案将安全能力直接部署在AI服务器内部，通过硬件加速避免消耗CPU/GPU资源。专为AI前端网络设计，支持多租户隔离和自动策略生成。

AMD 其他强信号 2026-03-19

AMD定义智能体计算机愿景推动端侧AI架构

AMD发布2026年AI PC路线图，提出智能体计算机概念，通过扩展Ryzen AI技术栈实现NPU、GPU、CPU异构计算架构。该架构支持本地运行多模态AI智能体，推动PC从生产力工具向主动AI伙伴转变。

AMD 其他中信号 2026-03-19

AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用

AMD 提出 Agentic AI 工作负载依赖串行决策和上下文管理，更适合 CPU 处理。公司强调高核心数、大内存带宽的服务器 CPU 将主导智能体编排和轻量级推理，补充 GPU 在训练中的角色。这反映了 CPU 在 AI 数据中心架构中的战略重新定位。

Amazon 其他强信号 2026-03-19

AWS与Cerebras推出推理解耦架构优化AI推理性能

AWS与Cerebras合作推出基于Trainium和CS-3的异构推理方案，采用计算与内存阶段解耦架构，通过EFA网络互连。该方案针对交互式AI应用优化，声称性能提升一个数量级，部署于Nitro安全环境。

Cisco 其他中信号 2026-03-18

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU，支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化，可实时分配PCIe GPU资源。该方案提供验证设计蓝图，加速AI推理、视觉AI等多工作负载的规模化部署。

AMD 其他强信号 2026-03-18

AMD与NAVER Cloud合作推进韩国主权AI基础设施建设

AMD与韩国NAVER Cloud宣布深化战略合作，旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器，并获得下一代Instinct MI455X GPU的早期访问权限，双方将共同优化AI服务与软件栈。

AMD 其他强信号 2026-03-18

AMD与三星深化合作，锁定HBM4供应并探索代工

AMD与三星签署谅解备忘录，将三星作为下一代Instinct MI455X GPU的HBM4主要供应商，并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。

NVIDIA 其他中信号 2026-03-18

NVIDIA CloudXR集成Vision Pro，强化企业级XR串流方案

NVIDIA宣布CloudXR平台支持Apple Vision Pro，通过RTX GPU实现云端高保真XR内容串流。该方案解决了移动头显算力限制，专注于工业设计与数字孪生等企业级应用。

情报

筛选

思科联合英伟达验证私有AI基础设施快速微调能力

ARM推出AGI CPU芯片，进军AI基础设施市场

HPE推出AI安全架构增强应对AI采用风险

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA 捐赠 GPU 动态资源分配驱动至 Kubernetes

ARM与NVIDIA推动AI工作站本地化变革

Check Point发布AI工厂安全蓝图：借NVIDIA BlueField将控制点下沉至GPU与LLM层

Check Point发布AI工厂安全蓝图 覆盖GPU至LLM全栈防护

Check Point发布AI工厂安全蓝图，定义分层防护架构

NVIDIA Blackwell架构实现25倍能效提升

英伟达CEO阐述加速计算范式，预示AI基础设施架构演进

NVIDIA阐述加速计算三阶段演进与软件定义数据中心战略

思科与英伟达合作将防火墙嵌入DPU实现AI服务器安全

AMD定义智能体计算机愿景推动端侧AI架构

AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用

AWS与Cerebras推出推理解耦架构优化AI推理性能

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

AMD与NAVER Cloud合作推进韩国主权AI基础设施建设

AMD与三星深化合作，锁定HBM4供应并探索代工

NVIDIA CloudXR集成Vision Pro，强化企业级XR串流方案

Check Point发布AI工厂安全蓝图覆盖GPU至LLM全栈防护