NVIDIA - AI基础设施情报搜索

Intel 其他 2025-06-02

Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI，正面挑战NVIDIA推理生态

Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台，以及全解耦推理服务Vector Core Compute，旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位，直接竞争NVIDIA的Vera Rubin NVL72。

NVIDIA 其他 2025-06-01

NVIDIA RTX Spark与Nemotron-3 Ultra：端侧AI控制权从云端下沉至个人PC

NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机（与联发科合作）及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片，提供1 PFLOPS本地AI算力，首次将大模型推理下沉至PC端，并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。

Microsoft 其他中信号 2025-02-27

微软推出Phi-4系列小语言模型，强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM)，包括5.6B参数的Phi-4-multimodal模型，支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog，重点优化边缘设备上的AI推理能力。

NVIDIA 其他 2024-09-25

NVIDIA Technologies and GPU Architectures | NVIDIA

NVIDIA Home NVIDIA Home ...

Google 其他强信号 2020-10-11

Google Cloud推出MCP与Apigee集成及Agentic Platform，推动企业API向AI Agent化演进

Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用，并推出Agentic Platform，旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施，为企业从API驱动转向Agent驱动架构提供了核心平台能力。

Other 其他 1970-01-01

Coherent获5千万美元补贴扩建InP产线，AI连接瓶颈催生光芯片军备竞赛

光通信芯片巨头Coherent获得美国CHIPS法案5000万美元补贴，扩建其德州6英寸磷化铟（InP）晶圆厂，产能提升4倍。NVIDIA已战略投资20亿美元锁定产能，创始人黄仁勋亲临现场，标志AI基础设施从算力堆叠转向光互连能力成为新瓶颈。

NVIDIA 其他 1970-01-01

NVIDIA 200亿美元购Groq LPU：推理芯片从HBM转向片上SRAM

NVIDIA与Groq达成约200亿美元技术许可协议，获取LPU（Language Processing Unit）核心技术与团队。LPU采用230MB片上SRAM，带宽80TB/s，专为Transformer推理解码优化，替代传统GPU的HBM瓶颈，重塑AI推理芯片格局。

NVIDIA 其他 1970-01-01

NVIDIA登顶数据中心以太网市场：GPU算力控制网络架构的转折点

IDC报告显示，NVIDIA在2026年Q1数据中心以太网交换机市场以21.5%份额首次登顶，营收21亿美元。这标志着Spectrum-X平台结合RoCE和NVLink技术，成功将GPU算力需求转化为网络控制权，直接冲击Cisco和Arista的传统地位。

Samsung Electronics 其他 1970-01-01

SK海力士HBM4E送样：3nm逻辑+384GB单GPU，引爆AI内存带宽军备竞赛

SK海力士向主要客户发出12层HBM4E样品，采用TSMC 3nm逻辑裸芯，单引脚带宽显著提升，目标平台为NVIDIA Rubin Ultra，每GPU容量达384GB。此举标志着与三星在下一代AI存储赛道正式进入抢跑阶段，HBM BOM占比已飙升至65-70%。

NVIDIA 其他 1970-01-01

英伟达吞下Groq LPU：Feynman GPU融合SRAM推理单元，混合架构加速2028

英伟达通过非排他许可与逆向招安获取Groq的LPU推理技术，计划在2028年Feynman GPU中采用台积电SoIC混合键合集成大容量SRAM芯片块，实现确定性调度与80TB/s片上带宽，从纯GPU供应商向混合推理/训练平台转型。

NVIDIA 其他 1970-01-01

NVIDIA Spectrum-X登顶以太网交换机市场：AI工厂生态重构网络产业格局

IDC报告显示，NVIDIA在2026年Q1以21亿美元营收（同比+192.7%）首次成为数据中心以太网交换机市场第一。核心驱动力是专为AI GPU集群设计的Spectrum-X平台，其整合了Spectrum交换机、BlueField DPU和LinkX线缆系统，标志着AI工厂网络从通用架构向垂直集成生态的根本性转变。

Intel 其他 1970-01-01

Intel获Google TPU封装大单：Foundry转型的里程碑，但TSMC仍是AI制造核心

Intel宣布将为Google生产超过300万颗Tensor Processing Unit，采用先进的EMIB-T封装技术，预计2028年交付。此订单是Intel Foundry迄今最大的外部AI芯片订单，但分析人士指出该交易主要涉及封装而非核心芯片制造，TSMC仍是Google TPU的主要晶圆代工厂。

NVIDIA 其他 1970-01-01

SGLang 0.5.13发布：MoE两阶段路由预判+稀疏缓存，推理性能跃升25倍

SGLang 0.5.13引入MoE模型专用路由预判（轻量代理网络预加载top-k expert权重）和稀疏KV缓存（按激活路径分组缓存），在NVIDIA GB300 NVL72平台实现25倍推理加速。A100实测吞吐+65%，延迟-40%，显存-10%，路由开销-62%，全面超越vLLM。

情报

筛选

Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI，正面挑战NVIDIA推理生态

NVIDIA RTX Spark与Nemotron-3 Ultra：端侧AI控制权从云端下沉至个人PC

微软推出Phi-4系列小语言模型，强化边缘AI与多模态推理能力

NVIDIA Technologies and GPU Architectures | NVIDIA

Google Cloud推出MCP与Apigee集成及Agentic Platform，推动企业API向AI Agent化演进

Coherent获5千万美元补贴扩建InP产线，AI连接瓶颈催生光芯片军备竞赛

NVIDIA 200亿美元购Groq LPU：推理芯片从HBM转向片上SRAM

NVIDIA登顶数据中心以太网市场：GPU算力控制网络架构的转折点

SK海力士HBM4E送样：3nm逻辑+384GB单GPU，引爆AI内存带宽军备竞赛

英伟达吞下Groq LPU：Feynman GPU融合SRAM推理单元，混合架构加速2028

NVIDIA Spectrum-X登顶以太网交换机市场：AI工厂生态重构网络产业格局

Intel获Google TPU封装大单：Foundry转型的里程碑，但TSMC仍是AI制造核心

SGLang 0.5.13发布：MoE两阶段路由预判+稀疏缓存，推理性能跃升25倍