CUDA - AI基础设施情报搜索

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark：统一内存架构重塑Agentic PC生态，合围x86阵营

Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台，采用统一内存架构，专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力，显著降低token处理成本，标志着PC从应用驱动向Agent驱动的根本转变，并得到微软的全面支持。

NVIDIA 其他 2026-06-01

NVIDIA借台湾供应链深化AI工厂生态，Vera Rubin量产捆绑专有软件锁

NVIDIA联合台积电、鸿海等台湾巨头，将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程，同时推进Vera Rubin NVL72量产。此举将制造效率提升数据（如cuLitho降低20-50%周期）作为诱饵，实质是构建从设计到生产的全栈生态壁垒。

NVIDIA 其他 2026-06-01

NVIDIA RTX Spark：以SoC形态夺取PC控制权，AI算力革命或锁定生态

NVIDIA发布RTX Spark SoC，集成Blackwell GPU与20核Grace CPU（MediaTek设计），通过NVLink-C2C实现600GB/s互联，最高128GB统一内存，1 petaflop FP4 AI算力，支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商，直接挑战Apple M系列、Qualcomm及x86阵营。

NVIDIA 其他 2026-05-16

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷：从驱动层到硬件层的安全范式必须重构

Pwn2Own Berlin 2026上，NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用，实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核，彻底打破当前依赖驱动隔离的GPU共享模型，迫使行业重新评估AI基础设施安全架构。

NVIDIA 产品发布强信号 2026-04-14

NVIDIA发布全球首个开源量子AI模型Ising

NVIDIA发布全球首个开源量子AI模型家族Ising，包含校准模型(350亿参数VLM)和解码模型(3D CNN)，性能超越行业标准2.5-3倍，校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用，量子股票大涨18%。

Nokia 其他强信号 2026-04-09

诺基亚获英伟达投资，联合推出AI-RAN平台加速6G演进

诺基亚与英伟达达成战略合作，后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网，推动5G向AI原生6G网络转型，T-Mobile将成为首个部署客户。

NVIDIA 其他强信号 2026-04-03

英伟达联合谷歌优化Gemma 4，强化本地AI代理基础设施

英伟达宣布与谷歌合作，针对其RTX、DGX Spark及Jetson平台，对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站，为本地AI代理（Agentic AI）提供从2B到31B参数的全栈模型支持。

NVIDIA 其他中信号 2026-04-03

NVIDIA 优化 Gemma 4 模型以加速本地代理 AI

NVIDIA 与 Google 合作优化 Gemma 4 系列模型，使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务，包括推理、编码和代理功能，适用于本地代理 AI 应用。

Cisco 其他中信号 2026-03-27

思科推出Nexus Hyperfabric AI方案，集成800G交换机与HGX B300 GPU

思科发布Nexus Hyperfabric AI基础设施方案，整合800G以太网交换机和NVIDIA HGX B300 GPU，提供全栈预集成或灵活的'自带'模式。该方案符合NVIDIA Cloud Partner计划，旨在简化AI基础设施部署与运维。

NVIDIA 其他强信号 2026-03-17

NVIDIA cuDF加速Spark数据处理，优化企业A/B测试工作流

NVIDIA通过cuDF GPU DataFrame库和CUDA-X库，在Google Kubernetes Engine上加速Apache Spark工作流，使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移，处理超10PB数据。

NVIDIA 其他中信号 2026-03-12

NVIDIA与达索系统集成虚拟孪生与AI物理模型平台

NVIDIA与达索系统合作，将达索的虚拟孪生平台与NVIDIA加速计算、AI物理开放模型及CUDA-X和Omniverse库结合。该集成通过SIMULIA软件实现基于AI的物理行为模拟，支持多行业即时预测仿真结果。

NVIDIA 其他中信号 2026-03-04

NVIDIA将CUDA Tile编程模型扩展至Julia语言

NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛，通过数据块抽象简化底层线程与内存管理，并保持与Python版本在语法和性能上的高度一致性。

Trend Micro 其他强信号 2026-03-03

Trend Micro发布AI安全报告，揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告，系统性地分析了AI供应链中的安全风险，包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出，企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

AMD 其他中信号 2026-03-02

AMD推出企业AI套件强化硬件软件整合

AMD发布企业AI套件，整合硬件与软件生态系统，提供从模型优化到部署的端到端工具链。该套件针对Instinct加速器和Ryzen AI处理器优化，旨在提升AI工作负载性能并降低开发复杂性。

AMD 其他强信号 2026-03-02

AMD推出AI开发者计划强化软件生态

AMD推出集中式AI开发者门户，提供ROCm软件栈、优化框架和工具支持，旨在降低开发门槛并提升其硬件性能。该计划通过预优化模型和社区支持系统性地补强AI软件生态，直接挑战NVIDIA的CUDA主导地位。

NVIDIA 其他 2026-01-23

NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍，锁定Blackwell生态

NVIDIA与Black Forest Labs合作，在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile，将FLUX.2推理延迟较H200降低6.3x（单卡）至10.2x（双卡），内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。

NVIDIA 其他 2025-11-08

NVIDIA发布交互式AI Agent：用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学

NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent，通过自然语言接口编排数据科学工作流，实现从数据加载到模型训练的端到端GPU加速，性能提升3-43倍。

NVIDIA 其他 2025-06-01

NVIDIA RTX Spark与Nemotron-3 Ultra：端侧AI控制权从云端下沉至个人PC

NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机（与联发科合作）及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片，提供1 PFLOPS本地AI算力，首次将大模型推理下沉至PC端，并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。

情报

筛选