筛选

×
当前筛选 清除全部
关键词: NVIDIA ×
183 情报总数
2/10 当前页
NVIDIA 其他 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

NVIDIA 合作伙伴 强信号 2026-05-02

NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局

NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。

NVIDIA 技术更新 强信号 2026-05-02

全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。

NVIDIA 其他 强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。

NVIDIA 其他 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

NVIDIA 其他 强信号 2026-05-01

英伟达发布DLSS 4.5 SDK及TensorRT for RTX插件,深化游戏AI渲染生态

英伟达向开发者开放DLSS 4.5 SDK,包含动态多帧生成和6X多帧生成模式,并推出用于虚幻引擎NNE的TensorRT for RTX插件,加速游戏内AI推理。同时,其研究项目Kimodo展示了文本生成3D角色动画的潜力。

NVIDIA 其他 中信号 2026-04-30

NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移

NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

NVIDIA 其他 强信号 2026-04-29

英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层

英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。

Google 其他 强信号 2026-04-29

谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长

谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。

Intel 其他 2026-04-29

Intel Q1验证CPU/GPU 1:4配比趋势:Xeon 6如何改变AI推理基础设施的TCO计算

Intel Q1验证CPU:GPU配比从1:8回升至1:4,Xeon 6成为NVIDIA DGX-Rubin CPU,AMX指令集使CPU可在推理场景替代入门级GPU,单节点TCO降低40-60%

Anthropic 其他 2026-04-29

Anthropic 9000亿估值背后:跨云算力布局如何重塑企业AI采购的厂商锁定风险

Anthropic以9000亿估值融资背后是三云算力布局策略,企业使用Claude实际在同时绑定AWS、Google、NVIDIA三方,厂商锁定风险从单云升级为跨云架构级锁定

NVIDIA 其他 强信号 2026-04-28

英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代

英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。

ARM 其他 强信号 2026-04-28

Arm发布Performix性能分析工具包,瞄准AI Agent时代优化

Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。

NVIDIA 产品发布 强信号 2026-04-27

NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%

NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。

NVIDIA 其他 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

Microsoft 其他 强信号 2026-04-23

微软在澳大利亚进行250亿澳元AI与云基础设施投资

微软宣布在澳大利亚进行其史上最大规模投资,总额达250亿澳元,旨在扩大AI和云计算基础设施容量、加强网络安全,并提升全国范围内的数字技能。此举旨在将澳大利亚定位为亚太地区的AI中心。

NVIDIA 产品发布 强信号 2026-04-23

NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命

NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。

NVIDIA 产品发布 强信号 2026-04-23

NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命

NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。调试效率从天级压缩至小时级,代码库探索从周级压缩至隔夜完成。黄仁勋向全体员工发送邮件鼓励使用:"让我们跃进光速。欢迎来到AI时代。"双方合作始于2016年DGX-1交付。

NVIDIA 其他 强信号 2026-04-22

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。