情报
AI 生成的结构化厂商动态简报
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。
微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力
微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。
NVIDIA Technologies and GPU Architectures | NVIDIA
NVIDIA Home NVIDIA Home ...
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。
Coherent获5千万美元补贴扩建InP产线,AI连接瓶颈催生光芯片军备竞赛
光通信芯片巨头Coherent获得美国CHIPS法案5000万美元补贴,扩建其德州6英寸磷化铟(InP)晶圆厂,产能提升4倍。NVIDIA已战略投资20亿美元锁定产能,创始人黄仁勋亲临现场,标志AI基础设施从算力堆叠转向光互连能力成为新瓶颈。
NVIDIA 200亿美元购Groq LPU:推理芯片从HBM转向片上SRAM
NVIDIA与Groq达成约200亿美元技术许可协议,获取LPU(Language Processing Unit)核心技术与团队。LPU采用230MB片上SRAM,带宽80TB/s,专为Transformer推理解码优化,替代传统GPU的HBM瓶颈,重塑AI推理芯片格局。
NVIDIA登顶数据中心以太网市场:GPU算力控制网络架构的转折点
IDC报告显示,NVIDIA在2026年Q1数据中心以太网交换机市场以21.5%份额首次登顶,营收21亿美元。这标志着Spectrum-X平台结合RoCE和NVLink技术,成功将GPU算力需求转化为网络控制权,直接冲击Cisco和Arista的传统地位。
SK海力士HBM4E送样:3nm逻辑+384GB单GPU,引爆AI内存带宽军备竞赛
SK海力士向主要客户发出12层HBM4E样品,采用TSMC 3nm逻辑裸芯,单引脚带宽显著提升,目标平台为NVIDIA Rubin Ultra,每GPU容量达384GB。此举标志着与三星在下一代AI存储赛道正式进入抢跑阶段,HBM BOM占比已飙升至65-70%。
英伟达吞下Groq LPU:Feynman GPU融合SRAM推理单元,混合架构加速2028
英伟达通过非排他许可与逆向招安获取Groq的LPU推理技术,计划在2028年Feynman GPU中采用台积电SoIC混合键合集成大容量SRAM芯片块,实现确定性调度与80TB/s片上带宽,从纯GPU供应商向混合推理/训练平台转型。
NVIDIA Spectrum-X登顶以太网交换机市场:AI工厂生态重构网络产业格局
IDC报告显示,NVIDIA在2026年Q1以21亿美元营收(同比+192.7%)首次成为数据中心以太网交换机市场第一。核心驱动力是专为AI GPU集群设计的Spectrum-X平台,其整合了Spectrum交换机、BlueField DPU和LinkX线缆系统,标志着AI工厂网络从通用架构向垂直集成生态的根本性转变。
Intel获Google TPU封装大单:Foundry转型的里程碑,但TSMC仍是AI制造核心
Intel宣布将为Google生产超过300万颗Tensor Processing Unit,采用先进的EMIB-T封装技术,预计2028年交付。此订单是Intel Foundry迄今最大的外部AI芯片订单,但分析人士指出该交易主要涉及封装而非核心芯片制造,TSMC仍是Google TPU的主要晶圆代工厂。
SGLang 0.5.13发布:MoE两阶段路由预判+稀疏缓存,推理性能跃升25倍
SGLang 0.5.13引入MoE模型专用路由预判(轻量代理网络预加载top-k expert权重)和稀疏KV缓存(按激活路径分组缓存),在NVIDIA GB300 NVL72平台实现25倍推理加速。A100实测吞吐+65%,延迟-40%,显存-10%,路由开销-62%,全面超越vLLM。