筛选

×
当前筛选 清除全部
关键词: GPU ×
189 情报总数
1/10 当前页
NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片,Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片,集成Blackwell RTX GPU和128GB统一内存,支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发,Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。

ARM 其他 2026-06-10

ARM以Neural Dawn演示移动神经图形:专用加速器将改写移动GPU架构

Arm联合Sumo Digital发布Neural Dawn,首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器,实现桌面级实时光线追踪和动态照明,同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争

AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存:AI推理延迟降低92%,但锁定风险暗藏

Google Cloud推出GKE Inference Gateway,通过前缀缓存和模型感知路由,在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态,企业需警惕架构弹性损失。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4:原生4位训练实现1.73倍吞吐跃升,锁定Blackwell生态

NVIDIA发布NVFP4格式,利用Blackwell原生硬件支持,在JAX/MaxText中实现4位混合精度预训练。相比FP8基线,Llama 3.1 405B在GB300上获得1.73倍吞吐提升,且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新,显著降低训练成本,但深度绑定NVIDIA硬件生态。

Cisco 其他 2026-06-08

思科推出AI原生分支架构:AgenticOps与后量子加密重塑WAN控制平面

思科在Cisco Live 2026上完成Secure Router 8000系列更新,推出Unified Branch架构,集成AgenticOps自动化、后量子密码学(PQC)和混合网状防火墙,将控制平面从本地迁移至Cisco Cloud Control,为AI时代分支网络提供统一平台。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-06-08

NVIDIA与LG共建AI工厂:以DSX平台锁定物理AI全栈生态

NVIDIA与LG集团联合建设AI工厂,基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架,覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确,从冷却组件到机器人平台均深度绑定NVIDIA架构,形成排他性生态。

NVIDIA 其他 2026-06-07

NVIDIA RTX Spark超级芯片:将AI代理与AAA游戏压缩进超薄笔记本,锁定个人计算生态

NVIDIA发布RTX Spark超级芯片,集成30年GPU/CPU/AI创新,实现1440p 144fps光追游戏与本地AI代理推理,支持DLSS 4.5。与KRAFTON、NC、Riot Games等合作,在韩国PC Bang首发,标志NVIDIA从独立GPU向个人计算SoC的战略转折。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。

Microsoft 其他 2026-06-02

微软Build大会:从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

Intel 其他 2026-06-02

英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。

NVIDIA 其他 强信号 2026-06-02

GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能

NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark:Agentic AI PC架构从x86转向Arm+GPU紧耦合

Arm与NVIDIA合作推出的RTX Spark采用Arm Grace CPU与Blackwell RTX GPU通过统一内存紧密耦合,专为Agentic AI时代设计,提供超低延迟本地推理能力。该平台标志着Windows on Arm生态的重大突破,旨在满足开发者、创作者和游戏玩家的高性能AI计算需求。