情报
AI 生成的结构化厂商动态简报
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地
Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。
Intel Q1验证CPU/GPU 1:4配比趋势:Xeon 6如何改变AI推理基础设施的TCO计算
Intel Q1验证CPU:GPU配比从1:8回升至1:4,Xeon 6成为NVIDIA DGX-Rubin CPU,AMX指令集使CPU可在推理场景替代入门级GPU,单节点TCO降低40-60%
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%
NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。
Intel Q1财报暴涨24%:数据中心营收51亿美元超预期,CPU重返AI核心
Intel 2026年Q1财报超预期,营收136亿美元同比增7%,Non-GAAP每股收益0.29美元超预期1350%。数据中心与AI部门营收51亿美元同比大涨22%,运营利润率31%。
Intel Q1财报暴涨24%:数据中心营收51亿美元超预期,CPU重返AI核心
Intel 2026年Q1财报超预期,营收136亿美元同比增7%,Non-GAAP每股收益0.29美元超预期1350%。数据中心与AI部门营收51亿美元同比大涨22%,运营利润率31%。Xeon服务器CPU需求强劲,AI PC占比超60%,与Google等签订多年供货协议。财报发布后股价大涨25%。
Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态
Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。
Google全域算力池化:资源利用率从35%提升至85%
Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。
思科通过新防火墙架构应对AI基础设施的规模化安全挑战
思科发布Secure Firewall 6100系列,通过软件数据平面重构和硬件优化,旨在为AI数据中心、云和电信环境提供高性能、高能效的安全防护。该方案强调在加密流量激增和东西向流量增长背景下,实现安全与性能的平衡,并与Hybrid Mesh Firewall架构集成,提供跨混合环境的一致性策略。
英特尔联合诺基亚与戴尔推出面向远边缘的UPF专用设备
英特尔、诺基亚与戴尔在MWC 2026上预展了一款基于英特尔至强6 SoC的远边缘UPF设备。该方案旨在为电信运营商在空间与功耗受限的远边缘环境提供高性能、低功耗的5G核心网用户面处理能力,并集成了AI功能。
英特尔与谷歌深化合作,共同定义异构AI基础设施核心
英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养
Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。
ARM联合Google优化Gemma 4设备端AI性能
ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
ARM推出自研AGI CPU芯片,扩展AI基础设施布局
ARM首次推出自研AGI CPU芯片,突破传统IP授权模式,提供从定制化芯片到完整平台解决方案的全栈能力。此举将重构AI基础设施供应链控制权,推动企业从硬件层优化AI工作负载部署效率。