inference - AI基础设施情报搜索

Check Point 其他 2026-03-23

Check Point发布AI工厂安全蓝图：借NVIDIA BlueField将控制点下沉至GPU与LLM层

Check Point发布AI工厂安全架构蓝图，与NVIDIA BlueField DPU深度集成，将防火墙和威胁防护嵌入硬件层，覆盖从GPU服务器到LLM提示的四个安全层级。同时推出AI Factory Firewall，实现无CPU/GPU开销的硬件加速安全，旨在锁定AI基础设施安全控制权。

AMD 其他强信号 2026-03-18

AMD与NAVER Cloud合作推进韩国主权AI基础设施建设

AMD与韩国NAVER Cloud宣布深化战略合作，旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器，并获得下一代Instinct MI455X GPU的早期访问权限，双方将共同优化AI服务与软件栈。

AMD 其他强信号 2026-03-18

AMD与三星深化合作，锁定HBM4供应并探索代工

AMD与三星签署谅解备忘录，将三星作为下一代Instinct MI455X GPU的HBM4主要供应商，并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。

NVIDIA 其他强信号 2026-03-18

英伟达与电信运营商共建AI网格，重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作，将现有分布式网络站点（如中心局、基站）升级为“AI网格”，旨在将AI推理能力部署到网络边缘，以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

HPE 其他强信号 2026-03-17

HPE联合NVIDIA推出AI Grid，构建分布式推理统一网格

HPE在NVIDIA GTC上发布AI Grid解决方案，基于NVIDIA参考架构，旨在将分布式的AI工厂和推理集群安全连接成一个统一的智能系统。该方案帮助服务提供商大规模部署和管理边缘推理站点，以满足AI原生应用对低延迟、可预测基础设施的需求。

HPE 其他强信号 2026-03-17

HPE与NVIDIA推出AI Grid Solution，构建AI WAN fabric

HPE宣布与NVIDIA合作推出AI Grid Solution，旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric，连接分布式推理站点与AI工厂，提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。

Cisco 其他强信号 2026-03-17

Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全

Cisco宣布扩展与NVIDIA的Secure AI Factory，支持从数据中心到边缘站点的AI部署，新增安全功能如防火墙策略在DPUs和AI防御集成，提供灵活架构选择加速生产部署。

HPE 其他强信号 2026-03-16

HPE Alletra MP X10000成为首个NVIDIA认证的企业AI对象存储平台

HPE宣布其Alletra Storage MP X10000成为首个获得NVIDIA认证的企业级AI对象存储平台。这标志着存储性能与AI工作负载的认证标准从计算层延伸至数据层，旨在解决大规模AI训练、微调和推理中的数据访问瓶颈。

NVIDIA 其他强信号 2026-03-14

英伟达发布Cosmos世界模型套件，强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型（WFM）套件的重要更新，包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据，并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理，以解决真实世界数据稀缺的瓶颈。

Trend Micro 其他强信号 2026-03-03

Trend Micro发布AI安全报告，揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告，系统性地分析了AI供应链中的安全风险，包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出，企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

Cisco 其他强信号 2026-02-10

思科发布AI基础设施芯片与AgenticOps平台，强化统一架构战略

思科推出Silicon One G300芯片和AgenticOps平台，旨在优化AI集群的网络性能和任务完成时间，同时通过统一的Nexus One管理平面简化混合云环境运维。其AI Defense解决方案更新重点关注AI供应链治理和运行时保护。

Cisco 其他强信号 2026-02-10

思科发布G300芯片与系统，定位AI Agent时代数据中心网络基础

思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统，采用液冷设计提升70%能效，支持1.6T光学模块，并升级Nexus One统一管理平面。

NVIDIA 其他 2026-01-23

NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍，锁定Blackwell生态

NVIDIA与Black Forest Labs合作，在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile，将FLUX.2推理延迟较H200降低6.3x（单卡）至10.2x（双卡），内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。

OpenAI 其他中信号 2026-01-14

OpenAI 与 Cerebras 合作提升 AI 推理基础设施

OpenAI 宣布与 Cerebras 合作，新增 750MW 高速 AI 计算能力，旨在降低推理延迟并优化 ChatGPT 实时 AI 工作负载性能。这一合作凸显 OpenAI 持续投资专用 AI 硬件以支撑其大规模模型服务的战略方向。

NVIDIA 其他 2025-11-08

NVIDIA发布交互式AI Agent：用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学

NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent，通过自然语言接口编排数据科学工作流，实现从数据加载到模型训练的端到端GPU加速，性能提升3-43倍。

Microsoft 其他中信号 2025-02-27

微软推出Phi-4系列小语言模型，强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM)，包括5.6B参数的Phi-4-multimodal模型，支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog，重点优化边缘设备上的AI推理能力。

Google 其他强信号 2020-10-11

Google Cloud推出MCP与Apigee集成及Agentic Platform，推动企业API向AI Agent化演进

Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用，并推出Agentic Platform，旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施，为企业从API驱动转向Agent驱动架构提供了核心平台能力。

情报

筛选