情报
AI 生成的结构化厂商动态简报
微软Build大会:从芯片到云构建Agent时代统一生态
微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。
Arm与NVIDIA联手推出RTX Spark:统一内存架构重塑Agentic PC生态,合围x86阵营
Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台,采用统一内存架构,专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力,显著降低token处理成本,标志着PC从应用驱动向Agent驱动的根本转变,并得到微软的全面支持。
NVIDIA借台湾供应链深化AI工厂生态,Vera Rubin量产捆绑专有软件锁
NVIDIA联合台积电、鸿海等台湾巨头,将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程,同时推进Vera Rubin NVL72量产。此举将制造效率提升数据(如cuLitho降低20-50%周期)作为诱饵,实质是构建从设计到生产的全栈生态壁垒。
NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态
NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。
NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷:从驱动层到硬件层的安全范式必须重构
Pwn2Own Berlin 2026上,NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用,实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核,彻底打破当前依赖驱动隔离的GPU共享模型,迫使行业重新评估AI基础设施安全架构。
NVIDIA发布全球首个开源量子AI模型Ising
NVIDIA发布全球首个开源量子AI模型家族Ising,包含校准模型(350亿参数VLM)和解码模型(3D CNN),性能超越行业标准2.5-3倍,校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用,量子股票大涨18%。
诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进
诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
思科推出Nexus Hyperfabric AI方案,集成800G交换机与HGX B300 GPU
思科发布Nexus Hyperfabric AI基础设施方案,整合800G以太网交换机和NVIDIA HGX B300 GPU,提供全栈预集成或灵活的'自带'模式。该方案符合NVIDIA Cloud Partner计划,旨在简化AI基础设施部署与运维。
NVIDIA cuDF加速Spark数据处理,优化企业A/B测试工作流
NVIDIA通过cuDF GPU DataFrame库和CUDA-X库,在Google Kubernetes Engine上加速Apache Spark工作流,使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移,处理超10PB数据。
NVIDIA与达索系统集成虚拟孪生与AI物理模型平台
NVIDIA与达索系统合作,将达索的虚拟孪生平台与NVIDIA加速计算、AI物理开放模型及CUDA-X和Omniverse库结合。该集成通过SIMULIA软件实现基于AI的物理行为模拟,支持多行业即时预测仿真结果。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
AMD推出企业AI套件强化硬件软件整合
AMD发布企业AI套件,整合硬件与软件生态系统,提供从模型优化到部署的端到端工具链。该套件针对Instinct加速器和Ryzen AI处理器优化,旨在提升AI工作负载性能并降低开发复杂性。
AMD推出AI开发者计划强化软件生态
AMD推出集中式AI开发者门户,提供ROCm软件栈、优化框架和工具支持,旨在降低开发门槛并提升其硬件性能。该计划通过预优化模型和社区支持系统性地补强AI软件生态,直接挑战NVIDIA的CUDA主导地位。
NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍,锁定Blackwell生态
NVIDIA与Black Forest Labs合作,在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile,将FLUX.2推理延迟较H200降低6.3x(单卡)至10.2x(双卡),内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。
NVIDIA发布交互式AI Agent:用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学
NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent,通过自然语言接口编排数据科学工作流,实现从数据加载到模型训练的端到端GPU加速,性能提升3-43倍。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。