情报
AI 生成的结构化厂商动态简报
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。
NVIDIA联合电信运营商构建分布式AI推理网格
NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。
三星与AMD深化AI硬件合作,提供HBM4内存与代工服务
三星将成为AMD下一代MI455X GPU的HBM4主要供应商,提供13Gbps带宽的高性能内存。双方还将合作开发针对第6代EPYC CPU的DDR5解决方案,并探讨三星为AMD提供代工服务的机会。
HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric
HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。
NVIDIA发布开源模型与NemoClaw栈推动本地AI代理部署
NVIDIA推出Nemotron 3 Super 120B和Nano 4B开源模型,以及NemoClaw软件栈,优化OpenClaw在NVIDIA设备上的运行。该技术栈支持本地模型部署,提升安全性和隐私性,避免云端token成本。同时与Unsloth合作推出网页界面,简化模型微调流程。
NVIDIA cuDF加速Spark数据处理,优化企业A/B测试工作流
NVIDIA通过cuDF GPU DataFrame库和CUDA-X库,在Google Kubernetes Engine上加速Apache Spark工作流,使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移,处理超10PB数据。
NVIDIA Project Rheo:用仿真训练医院机器人,控制点从现实转向虚拟
NVIDIA发布Project Rheo蓝图,整合Isaac Sim、GR00T VLA模型和合成数据生成,用于医院机器人自动化。开发者可在数字孪生中训练物理AI策略,包括定位操作(如手术托盘拾取)和精密双手操作(如套管组装),并通过Cosmos Transfer 2.5跨场景泛化。
Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全
Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。
英特尔至强6成为NVIDIA DGX Rubin主机CPU,强化AI推理基础设施
英特尔至强6处理器被选为NVIDIA DGX Rubin NVL8 AI系统的主机CPU,提供3倍内存带宽提升和全路径机密计算能力。该合作凸显了CPU在AI推理负载中负责数据编排、调度和安全的架构价值。
HPE与NVIDIA深化AI工厂合作,推出全栈式超算解决方案
HPE在GTC 2026上宣布升级与NVIDIA的AI计算产品组合,推出面向大规模AI工厂和超级计算机的全栈解决方案,整合计算、GPU、网络、液冷、软件与服务,旨在提升部署效率与洞察速度。
HPE Alletra MP X10000成为首个NVIDIA认证的企业AI对象存储平台
HPE宣布其Alletra Storage MP X10000成为首个获得NVIDIA认证的企业级AI对象存储平台。这标志着存储性能与AI工作负载的认证标准从计算层延伸至数据层,旨在解决大规模AI训练、微调和推理中的数据访问瓶颈。
NVIDIA Warp:可微分物理模拟框架,打通AI训练与GPU加速
NVIDIA发布Warp框架,允许用Python编写GPU加速的物理模拟代码,并原生支持自动微分。通过2D Navier-Stokes求解器示例,展示了如何将模拟直接集成到AI优化流程中,降低物理AI训练数据生成成本。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。
NVIDIA推出RTX PRO Server虚拟化方案优化游戏开发AI基础设施
NVIDIA发布RTX PRO Server,基于RTX PRO 6000 GPU和vGPU软件构建集中式虚拟化GPU平台。支持MIG技术将单GPU划分为48个用户实例,提升资源利用率和团队协作效率。整合AI训练与图形工作流,实现动态资源分配和跨地域开发统一。
英伟达通过ComfyUI优化与硬件协同强化AI视频生成平台
英伟达在GDC发布针对本地AI视频生成的重大更新,包括ComfyUI界面简化、NVFP4/FP8格式原生支持带来2.5倍性能提升,以及RTX Video Super Resolution节点实现高效4K超分。这些优化通过软硬件深度协同,显著降低专业AI视频创作门槛并提升效率。
台积电技术平台战略转向系统级代工服务
台积电推出技术平台战略,整合先进制程与3D封装技术,为移动计算、高性能计算、汽车电子和物联网四大场景提供定制化半导体解决方案。该战略标志着从单纯工艺代工向系统级解决方案提供的转型,通过垂直整合强化客户绑定与服务壁垒。
AMD发布ROCm完整技术文档强化AI开发生态
AMD发布ROCm平台全面技术文档,涵盖安装部署、系统优化和性能调优指南,特别针对MI300X GPU提供专项优化。文档支持HIP、OpenCL等多种编程模型,提升开发者在AI/HPC工作负载中的GPU利用效率。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
苹果推出M5芯片强化AI计算能力
苹果发布搭载自研M5芯片的新款MacBook Air,CPU性能宣称全球最快,AI任务处理比M4提升4倍。集成神经加速器并支持Wi-Fi 7,存储容量翻倍至512GB起。
苹果M5芯片集成神经加速器强化本地AI推理
苹果发布M5 Pro和M5 Max芯片,采用Fusion架构集成双晶粒SoC,每个GPU核心内置神经加速器,AI性能相比前代提升4倍。统一内存带宽最高614GB/s,支持128GB内存,针对本地LLM处理和AI模型训练优化。