I
Intel
2026-06-02
Vendor Strategy 影响: Important 置信: 85%

英特尔联合SambaNova推机架级AI推理方案,至强6+ 288核重夺话语权

内容摘要

英特尔在Computex 2026推出基于至强6+处理器和SambaNova SN-50 RDU的机架级AI基础设施,以及采用解耦推理(预填充/解码分离)的Vector Core Compute云服务。至强6+基于Intel 18A,288核,专为横向扩展的Agentic AI推理设计,意图以CPU+RDU组合降低推理TCO。

核心要点

英特尔在Computex 2026发布多项AI创新,核心是机架级AI基础设施:将至强6+处理器(基于Intel 18A,288核,专为横向扩展与Agentic AI设计)与SambaNova SN-50 RDU(可重构数据流单元)集成,由富士康提供系统集成。该机架在32U、100kW功耗下提供36864个核心,宣称业界领先的Agentic AI部署密度。

同时推出Vector Core Compute——由Vista Equity Partners和Cambium Capital打造的企业推理云,采用完全解耦推理架构:至强6负责编排与执行,SambaNova SN40 RDU负责解码,NVIDIA Blackwell GPU负责预填充。Together.ai率先部署,在MiniMax 2.5模型上实现最快企业级推理。

此外,英特尔与富士康、西门子、日立等达成行业合作,探索定制芯片与垂直方案。至强6+首次将Intel 18A用于数据中心CPU,强调在真实功耗限制下的持续性能输出,聚焦Agentic AI任务编排、并发处理和数据迁移。

重要性说明

英特尔此举表面是技术突破,实则在防守NVIDIA和AMD在AI推理市场的合围。通过将CPU重新定位为推理核心(宣称1:1 CPU/GPU配比),英特尔试图剥夺NVIDIA GPU在推理环节的垄断地位,并将控制点从GPU生态(CUDA、TensorRT)转移到自己的x86 + RDU组合。但存在隐性锁定:SambaNova RDU是专有可重构架构,其软件栈(SN-OS)与英特尔紧密绑定,一旦采用,用户难以迁移至其他加速器,形成双供应商锁定(Intel + SambaNova)。

原文刻意隐瞒的物理限制:至强6+的288核虽密度高,但单核性能可能不及AMD EPYC的Zen 5,且Intel 18A良率尚在爬坡,实际可用核心数可能打折。解耦推理虽降低预填充延迟,但RDU解码的尾部延迟(Tail Latency)在复杂Agentic工作流中可能因数据流重配置而抖动,PFC/ECN拥塞控制机制在跨节点RDU通信时仍是瓶颈。此外,Vector Core Compute的“完全解耦”依赖NVIDIA GPU做预填充,这反而强化了NVIDIA在预填充环节的控制,并非真正的全栈独立。

PRO 决策建议

【厂商(AMD、NVIDIA、Arm服务器阵营)】

  • AMD:立即针对至强6+的单核性能短板推出对比基准测试,强调EPYC在高并发推理场景下的每瓦性能优势。联合RDU替代厂商(如Groq、Cerebras)构建开放推理生态,攻击SambaNova的专有锁定
  • NVIDIA:强化NVIDIA AI EnterpriseTensorRT-LLM在解耦推理中的预填充优势,推出全GPU解耦方案(无需CPU+RDU),强调CUDA生态的成熟度尾部延迟可控性
  • Arm服务器阵营(如Ampere):推广高密度ARM CPU直接替代至强6+,强调更低功耗开源软件栈,避免RDU绑定。

【企业CIO与架构师】

  • 对英特尔的机架级AI基础设施进行零信任技术审计:要求提供独立第三方(如MLPerf Inference)的端到端延迟与吞吐量测试,特别关注多Agent并发下的尾部延迟
  • 评估SambaNova RDU的迁移成本:要求英特尔提供标准OpenAPI接口(如OpenAI兼容API),确保未来可替换为其他加速器。
  • 警惕Vector Core Compute双供应商锁定:优先选择基于标准Kubernetes和Ray的开放推理平台,避免被绑定至特定云服务。

【投资者】

  • 英特尔此次发布是短期公关利好,但Intel 18A良率风险SambaNova生态脆弱性未被充分披露。实际营收贡献取决于企业客户是否接受CPU+RDU的TCO承诺,而非纸面密度。
  • 关注NVIDIA和AMD的回应:若NVIDIA推出纯GPU解耦方案并降低预填充成本,英特尔的推理叙事将失去吸引力。建议减持英特尔,增持SambaNova的竞争对手(如Groq),因其拥有更成熟的可重构架构更低延迟

来源: 英特尔新闻室
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)