筛选

×
当前筛选 清除全部
关键词: NVIDIA ×
289 情报总数
6/15 当前页
NVIDIA 产品发布 2026-05-29

NVIDIA Blackwell Ultra GB300 NVL72:FP4算力1.44 EFLOPS,AI工厂性能跃升50倍

NVIDIA发布Blackwell Ultra GB300 NVL72机架系统,集成72颗Blackwell Ultra GPU和36颗Grace CPU,FP4稀疏算力达1,440 PFLOPS,配备20TB HBM3e和130TB/s NVLink,相比Hopper AI工厂输出提升50倍,已上市。

NVIDIA 产品发布 2026-05-29

NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层

NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。

NVIDIA 其他 2026-05-27

NVIDIA Vera CPU实测碾压x86:Agentic AI时代的内存带宽霸权

Phoronix基准测试显示,NVIDIA Vera CPU凭借88核自研Olympus核心(Armv9.2)、1.2TB/s LPDDR5X带宽及450W TDP,在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越,Linux内核编译仅20秒。

Intel 其他 2026-05-25

Intel CEO断言AI推理时代CPU/GPU配比逆转,Multi-Agent将CPU推回算力中心

Intel CEO Lip-Bu Tan预测AI推理推动CPU/GPU配比从1:8演进至1:1甚至4:1,Multi-Agent三大刚性需求(OS调度、KVCache卸载、高并发工具调用)将CPU从配角变主角。NVIDIA、AMD、Intel三路CPU量产共振,确认CPU需求大周期。

NVIDIA 其他 2026-05-25

NVIDIA Vera CPU冲击x86:1.5倍性能与4倍密度,AI推理全栈锁定

据传闻,NVIDIA将在Computex 2026展示自研通用CPU Vera,性能达x86的1.5倍、吞吐量2倍、机架密度4倍。FY2027出货目标120万颗,FY2028达420万颗。Vera旨在满足AI推理时代CPU/GPU配比从1:8向1:1演进的需求,与Grace双线并行,构建GPU+CPU全栈生态。

Google 产品发布 2026-05-22

Google I/O 2026全面押注Agentic AI:Antigravity平台与TPU 8t/8i重构AI基础设施控制权

Google在I/O 2026发布Gemini 3.5 Flash(4倍输出速度)、Antigravity 2.0多Agent编排平台、TPU 8t/8i(训练3倍/推理2倍性能提升)及Gemini Spark个人助手,全面转向Agentic AI系统级基础设施。通过Antigravity平台和定制TPU,Google意图锁定开发者生态,将控制点从模型API转移至编排与硬件层。

Intel 其他 2026-05-20

Intel Core Ultra Series 3 以集成SoC替代离散GPU,重塑边缘机器人推理性价比

Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU,成为Sensory AI等多家机器人公司的边缘推理主力,完全替代昂贵、高功耗的离散GPU。通过异构计算,机器人可在本地运行视觉、语言、运动等多智能体,无需云端,显著降低总拥有成本与部署门槛。

Google 其他 2026-05-19

Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

NVIDIA 其他 2026-05-16

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷:从驱动层到硬件层的安全范式必须重构

Pwn2Own Berlin 2026上,NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用,实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核,彻底打破当前依赖驱动隔离的GPU共享模型,迫使行业重新评估AI基础设施安全架构。

Cisco 其他 2026-05-14

Cisco借MRC协议推销SRv6:AI网络生态的隐性控制权争夺

Cisco在博客中宣称MRC协议依赖其主导的SRv6架构,并强调SRv6在AI超算中的三大优势:应用驱动、静态路由可靠性、确定性探测。这实为Cisco试图通过SRv6标准锁定AI网络生态,对抗NVIDIA Spectrum-X和Arista的方案。

Cisco 其他 2026-05-13

Cisco推N9300 Smart Switch融合安全,AI数据中心控制点转向网络基础设施

Cisco在ONUG 2026发布Nexus One架构与N9300系列智能交换机,将L4分段、Hypershield、eBPF Live Protect及与NVIDIA BlueField DPU集成的防火墙直接嵌入网络,旨在为AI工作负载提供无性能瓶颈的深度安全,同时通过AgenticOps和AI Canvas实现智能运维。

ARM 其他 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

NVIDIA 其他 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

Anthropic 其他 强信号 2026-05-06

Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。

NVIDIA 其他 2026-05-05

NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点

NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。

Cisco 其他 强信号 2026-05-05

思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全

思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。

NVIDIA 合作伙伴 强信号 2026-05-02

NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局

NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。

NVIDIA 技术更新 强信号 2026-05-02

全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。

NVIDIA 其他 强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。