筛选

×
当前筛选 清除全部
关键词: Blackwell ×
40 情报总数
1/2 当前页
Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark:统一内存架构重塑Agentic PC生态,合围x86阵营

Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台,采用统一内存架构,专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力,显著降低token处理成本,标志着PC从应用驱动向Agent驱动的根本转变,并得到微软的全面支持。

NVIDIA 其他 2026-06-01

NVIDIA FOX蓝图:工厂控制层从PLC转向AI代理,锁定DGX硬件

NVIDIA发布Factory Operations Blueprint (FOX),基于NemoClaw和DGX Station (GB300 Grace Blackwell Ultra Desktop Superchip)构建自主工厂管理代理,整合机器信号、质量系统与机器人车队,实现全厂智能决策。富士康、和硕、研华、纬创已部署,预计根因分析效率提升80%,劳动生产力提升15%。

NVIDIA 其他 2026-06-01

NVIDIA借台湾供应链深化AI工厂生态,Vera Rubin量产捆绑专有软件锁

NVIDIA联合台积电、鸿海等台湾巨头,将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程,同时推进Vera Rubin NVL72量产。此举将制造效率提升数据(如cuLitho降低20-50%周期)作为诱饵,实质是构建从设计到生产的全栈生态壁垒。

NVIDIA 其他 2026-06-01

NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态

NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。

NVIDIA 产品发布 2026-05-29

NVIDIA Blackwell Ultra GB300 NVL72:FP4算力1.44 EFLOPS,AI工厂性能跃升50倍

NVIDIA发布Blackwell Ultra GB300 NVL72机架系统,集成72颗Blackwell Ultra GPU和36颗Grace CPU,FP4稀疏算力达1,440 PFLOPS,配备20TB HBM3e和130TB/s NVLink,相比Hopper AI工厂输出提升50倍,已上市。

NVIDIA 产品发布 2026-05-29

NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层

NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。

NVIDIA 其他 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

NVIDIA 其他 2026-05-05

NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点

NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。

NVIDIA 技术更新 强信号 2026-05-02

全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

Google 其他 2026-04-29

Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地

Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。

NVIDIA 产品发布 强信号 2026-04-27

NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%

NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。

NVIDIA 其他 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

NVIDIA 其他 强信号 2026-04-22

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。

Google 其他 2026-04-22

Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态

Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。

NVIDIA 其他 强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。

NVIDIA 财务新闻 强信号 2026-04-15

NVIDIA GPU租金2个月上涨48%

NVIDIA Blackwell GPU租金达4.08美元/小时,2个月上涨48%。中国云厂商同步涨价,智谱API Q1累计上调83%。

Google 其他 强信号 2026-04-03

谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他 中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。