NVIDIA - AI基础设施情报搜索

NVIDIA 产品发布 2026-05-29

NVIDIA Blackwell Ultra GB300 NVL72：FP4算力1.44 EFLOPS，AI工厂性能跃升50倍

NVIDIA发布Blackwell Ultra GB300 NVL72机架系统，集成72颗Blackwell Ultra GPU和36颗Grace CPU，FP4稀疏算力达1,440 PFLOPS，配备20TB HBM3e和130TB/s NVLink，相比Hopper AI工厂输出提升50倍，已上市。

NVIDIA 产品发布 2026-05-29

NVIDIA三线并发：Vera CPU交付、N1X笔记本芯片与硅光子学投资，重构AI基础设施控制层

NVIDIA交付首款Agent专用Vera CPU（88核Arm v9.2, 1.2TB/s内存带宽），预告消费级N1X笔记本处理器，并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态，同时通过CPO技术解决内存墙问题，但量产挑战持续至2028年后。

NVIDIA 其他 2026-05-27

NVIDIA Vera CPU实测碾压x86：Agentic AI时代的内存带宽霸权

Phoronix基准测试显示，NVIDIA Vera CPU凭借88核自研Olympus核心（Armv9.2）、1.2TB/s LPDDR5X带宽及450W TDP，在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越，Linux内核编译仅20秒。

Intel 其他 2026-05-25

Intel CEO断言AI推理时代CPU/GPU配比逆转，Multi-Agent将CPU推回算力中心

Intel CEO Lip-Bu Tan预测AI推理推动CPU/GPU配比从1:8演进至1:1甚至4:1，Multi-Agent三大刚性需求（OS调度、KVCache卸载、高并发工具调用）将CPU从配角变主角。NVIDIA、AMD、Intel三路CPU量产共振，确认CPU需求大周期。

NVIDIA 其他 2026-05-25

NVIDIA Vera CPU冲击x86：1.5倍性能与4倍密度，AI推理全栈锁定

据传闻，NVIDIA将在Computex 2026展示自研通用CPU Vera，性能达x86的1.5倍、吞吐量2倍、机架密度4倍。FY2027出货目标120万颗，FY2028达420万颗。Vera旨在满足AI推理时代CPU/GPU配比从1:8向1:1演进的需求，与Grace双线并行，构建GPU+CPU全栈生态。

Google 产品发布 2026-05-22

Google I/O 2026全面押注Agentic AI：Antigravity平台与TPU 8t/8i重构AI基础设施控制权

Google在I/O 2026发布Gemini 3.5 Flash（4倍输出速度）、Antigravity 2.0多Agent编排平台、TPU 8t/8i（训练3倍/推理2倍性能提升）及Gemini Spark个人助手，全面转向Agentic AI系统级基础设施。通过Antigravity平台和定制TPU，Google意图锁定开发者生态，将控制点从模型API转移至编排与硬件层。

Intel 其他 2026-05-20

Intel Core Ultra Series 3 以集成SoC替代离散GPU，重塑边缘机器人推理性价比

Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU，成为Sensory AI等多家机器人公司的边缘推理主力，完全替代昂贵、高功耗的离散GPU。通过异构计算，机器人可在本地运行视觉、语言、运动等多智能体，无需云端，显著降低总拥有成本与部署门槛。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

NVIDIA 其他 2026-05-16

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷：从驱动层到硬件层的安全范式必须重构

Pwn2Own Berlin 2026上，NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用，实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核，彻底打破当前依赖驱动隔离的GPU共享模型，迫使行业重新评估AI基础设施安全架构。

Cisco 其他 2026-05-14

Cisco借MRC协议推销SRv6：AI网络生态的隐性控制权争夺

Cisco在博客中宣称MRC协议依赖其主导的SRv6架构，并强调SRv6在AI超算中的三大优势：应用驱动、静态路由可靠性、确定性探测。这实为Cisco试图通过SRv6标准锁定AI网络生态，对抗NVIDIA Spectrum-X和Arista的方案。

Cisco 其他 2026-05-13

Cisco推N9300 Smart Switch融合安全，AI数据中心控制点转向网络基础设施

Cisco在ONUG 2026发布Nexus One架构与N9300系列智能交换机，将L4分段、Hypershield、eBPF Live Protect及与NVIDIA BlueField DPU集成的防火墙直接嵌入网络，旨在为AI工作负载提供无性能瓶颈的深度安全，同时通过AgenticOps和AI Canvas实现智能运维。

ARM 其他强信号 2026-05-07

Arm发布创纪录财报，AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩，年收入达49.2亿美元，连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU，其数据中心市场获得超20亿美元客户需求，并获Meta、AWS、Google等巨头支持。

NVIDIA 其他强信号 2026-05-06

英伟达通过OCP开放MRC协议，推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC（多路径可靠连接）RDMA传输协议通过开放计算项目（OCP）开放。该协议旨在通过多路径负载均衡和硬件级故障绕过，提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

Anthropic 其他强信号 2026-05-06

Anthropic与SpaceX达成算力协议，大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议，将使用其Colossus 1数据中心全部算力，获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力，并已立即提高Claude Code和API的使用限制。

NVIDIA 其他 2026-05-05

NVIDIA极端协同设计：用Vera Rubin平台锁定代理AI推理的TCO拐点

NVIDIA发布针对代理系统（Agentic Systems）的极端协同设计架构，包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络，试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾，降低每token成本。

Cisco 其他强信号 2026-05-05

思科发布Nexus Dashboard 4.2，强化AI工作负载的网络监控与安全

思科发布数据中心管理平台Nexus Dashboard 4.2，核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由，以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。

NVIDIA 合作伙伴强信号 2026-05-02

NVIDIA与Intel达成50亿美元战略合作：AI芯片供应链新格局

NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作：NVIDIA投资50亿美元获得Intel约4%股权，Intel为NVIDIA定制x86 CPU（用于AI基础设施）和集成RTX GPU芯粒的x86 SoC（用于PC产品）。双方通过NVLink实现架构互连，形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局，对AMD和独立芯片设计厂商产生深远影响。

NVIDIA 技术更新强信号 2026-05-02

全球GPU短缺将持续至2027年：AI基础设施扩张的核心瓶颈

全球GPU短缺预计延续至2027-2028年，根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻（目标从200万降至150万颗），2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元，企业AI基础设施采购周期将进一步延长。

NVIDIA 其他强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作，推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现，整合OpenShell安全运行时与Nemotron开源模型，为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战，将AI基础设施控制点向本地、安全、可审计的架构迁移。

NVIDIA 其他强信号 2026-04-30

英伟达发布企业级AI工厂参考架构，推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构，为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件，旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

情报

筛选