筛选

×
当前筛选 清除全部
关键词: inference ×
97 情报总数
5/5 当前页
Check Point 其他 2026-03-23

Check Point发布AI工厂安全蓝图:借NVIDIA BlueField将控制点下沉至GPU与LLM层

Check Point发布AI工厂安全架构蓝图,与NVIDIA BlueField DPU深度集成,将防火墙和威胁防护嵌入硬件层,覆盖从GPU服务器到LLM提示的四个安全层级。同时推出AI Factory Firewall,实现无CPU/GPU开销的硬件加速安全,旨在锁定AI基础设施安全控制权。

AMD 其他 强信号 2026-03-18

AMD与NAVER Cloud合作推进韩国主权AI基础设施建设

AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。

AMD 其他 强信号 2026-03-18

AMD与三星深化合作,锁定HBM4供应并探索代工

AMD与三星签署谅解备忘录,将三星作为下一代Instinct MI455X GPU的HBM4主要供应商,并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。

NVIDIA 其他 强信号 2026-03-18

英伟达与电信运营商共建AI网格,重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

HPE 其他 强信号 2026-03-17

HPE联合NVIDIA推出AI Grid,构建分布式推理统一网格

HPE在NVIDIA GTC上发布AI Grid解决方案,基于NVIDIA参考架构,旨在将分布式的AI工厂和推理集群安全连接成一个统一的智能系统。该方案帮助服务提供商大规模部署和管理边缘推理站点,以满足AI原生应用对低延迟、可预测基础设施的需求。

HPE 其他 强信号 2026-03-17

HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric

HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。

Cisco 其他 强信号 2026-03-17

Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全

Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。

HPE 其他 强信号 2026-03-16

HPE Alletra MP X10000成为首个NVIDIA认证的企业AI对象存储平台

HPE宣布其Alletra Storage MP X10000成为首个获得NVIDIA认证的企业级AI对象存储平台。这标志着存储性能与AI工作负载的认证标准从计算层延伸至数据层,旨在解决大规模AI训练、微调和推理中的数据访问瓶颈。

NVIDIA 其他 强信号 2026-03-14

英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。

Trend Micro 其他 强信号 2026-03-03

Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

Cisco 其他 强信号 2026-02-10

思科发布AI基础设施芯片与AgenticOps平台,强化统一架构战略

思科推出Silicon One G300芯片和AgenticOps平台,旨在优化AI集群的网络性能和任务完成时间,同时通过统一的Nexus One管理平面简化混合云环境运维。其AI Defense解决方案更新重点关注AI供应链治理和运行时保护。

Cisco 其他 强信号 2026-02-10

思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础

思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。

NVIDIA 其他 2026-01-23

NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍,锁定Blackwell生态

NVIDIA与Black Forest Labs合作,在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile,将FLUX.2推理延迟较H200降低6.3x(单卡)至10.2x(双卡),内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。

OpenAI 其他 中信号 2026-01-14

OpenAI 与 Cerebras 合作提升 AI 推理基础设施

OpenAI 宣布与 Cerebras 合作,新增 750MW 高速 AI 计算能力,旨在降低推理延迟并优化 ChatGPT 实时 AI 工作负载性能。这一合作凸显 OpenAI 持续投资专用 AI 硬件以支撑其大规模模型服务的战略方向。

NVIDIA 其他 2025-11-08

NVIDIA发布交互式AI Agent:用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学

NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent,通过自然语言接口编排数据科学工作流,实现从数据加载到模型训练的端到端GPU加速,性能提升3-43倍。

Microsoft 其他 中信号 2025-02-27

微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。

Google 其他 强信号 2020-10-11

Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进

Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。