情报
AI 生成的结构化厂商动态简报
NVIDIA Rubin时代:1.8kW GPU功耗与液冷强制化的数据中心重构
NVIDIA液冷强制化是AI基础设施物理形态"质变"的标志性事件。当芯片功耗突破1.8kW,风冷物理极限被击穿,整个数据中心产业链——从电力架构、散热系统到建筑结构——都必须重新设计。这不是技术升级,而是范式转换。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell系列GPU云端现货租金达4.08美元/小时,较两个月前上涨48%。
微软发布高效AI图像模型,成本降低41%并瞄准规模化生产
微软发布MAI-Image-2-Efficient模型,在保持旗舰级质量的同时,推理速度提升22%,效率提升4倍,成本降低41%。该模型定位为规模化生产“主力”,已集成至Microsoft Foundry和Copilot,旨在降低企业AI应用门槛。
NVIDIA发布全球首个开源量子AI模型Ising
NVIDIA发布全球首个开源量子AI模型家族Ising,包含校准模型(350亿参数VLM)和解码模型(3D CNN),性能超越行业标准2.5-3倍,校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用,量子股票大涨18%。
英特尔与谷歌深化合作,共同定义异构AI基础设施核心
英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进
诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。
诺基亚深化AI-RAN合作,推动网络向AI原生演进
诺基亚宣布与英伟达等伙伴深化AI-RAN合作,旨在将AI深度集成至无线接入网,并推动网络向自主化、AI原生6G演进。此举凸显了网络基础设施作为AI时代关键支撑层的战略地位。
Google Cloud Next 2026:企业AI代理平台"登堂入室"的标志性时刻
Google Cloud Next 2026代表了AI平台竞争的"登堂入室"时刻。Gemini Enterprise Agent Platform的发布表明,大型云厂商已从"提供AI能力"转向"提供AI工作流"。平台捆绑战正式开打,企业需要在"功能完整性"和"供应商锁定风险"之间做出选择。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
思科深化与Nutanix合作,将超融合架构扩展至AI及边缘
思科宣布与Nutanix合作的多项进展,核心是将Nutanix云平台集成到思科AI POD、统一边缘及FlashStack架构中,旨在为从核心到边缘的AI和传统工作负载提供统一的、经过验证的部署蓝图与运营模型。
Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养
Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
思科推出验证式AI基础设施解决方案
思科发布经过验证的AI基础设施设计方案,通过与NVIDIA和红帽合作,提供预集成、测试的AI POD解决方案,旨在解决企业DIY AI基础设施时的兼容性和安全问题。该方案包含计算、网络、存储和AI软件的完整堆栈,并提供模块化扩展能力。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。