GPU - AI基础设施情报搜索

Cisco 其他中信号 2026-04-08

思科深化与Nutanix合作，将超融合架构扩展至AI及边缘

思科宣布与Nutanix合作的多项进展，核心是将Nutanix云平台集成到思科AI POD、统一边缘及FlashStack架构中，旨在为从核心到边缘的AI和传统工作负载提供统一的、经过验证的部署蓝图与运营模型。

Microsoft 其他强信号 2026-04-06

微软联合日本本土运营商构建主权AI基础设施

微软宣布未来四年在日投资100亿美元，核心是与日本樱花互联网和软银合作，通过Azure提供由本土运营商管理的GPU算力服务，确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。

Anthropic 其他强信号 2026-04-06

Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力

Anthropic宣布与谷歌及博通达成新协议，锁定数千兆瓦的下一代TPU算力，预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理，并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。

NVIDIA 其他强信号 2026-04-03

英伟达联合谷歌优化Gemma 4，强化本地AI代理基础设施

英伟达宣布与谷歌合作，针对其RTX、DGX Spark及Jetson平台，对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站，为本地AI代理（Agentic AI）提供从2B到31B参数的全栈模型支持。

NVIDIA 其他中信号 2026-04-03

NVIDIA 优化 Gemma 4 模型以加速本地代理 AI

NVIDIA 与 Google 合作优化 Gemma 4 系列模型，使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务，包括推理、编码和代理功能，适用于本地代理 AI 应用。

Google 其他强信号 2026-04-03

谷歌发布Gemma 4开源模型，瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族，包含从2B到31B的四个版本，强调单位参数性能突破，并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化，旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列，包含四种规模变体，特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言，采用Apache 2.0许可。

Cisco 其他中信号 2026-04-02

思科推出验证式AI基础设施解决方案

思科发布经过验证的AI基础设施设计方案，通过与NVIDIA和红帽合作，提供预集成、测试的AI POD解决方案，旨在解决企业DIY AI基础设施时的兼容性和安全问题。该方案包含计算、网络、存储和AI软件的完整堆栈，并提供模块化扩展能力。

AMD 其他强信号 2026-04-02

AMD发布突破性MLPerf 6.0推理结果，展示多节点扩展与多模态能力

AMD在MLPerf Inference 6.0基准测试中，凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型（Wan-2.2-t2v）的快速启用，以及广泛的合作伙伴生态系统复现结果。

Intel 其他中信号 2026-04-01

英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能

英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能，特别是在处理大型语言模型（LLM）时的表现。测试结果显示，配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型，并在多GPU设置中提供高达1.8倍的推理性能提升。

Qualcomm 其他强信号 2026-03-31

高通推出集成NPU的可穿戴平台，强化边缘AI与“个人AI生态”

高通发布Snapdragon Wear Elite平台，首次为可穿戴设备集成专用NPU，支持本地运行高达20亿参数模型。该平台旨在将AI计算从智能手机中心转向以个人AI代理为中心的架构，利用可穿戴设备提供持续上下文，实现跨设备智能协同。

Cisco 其他强信号 2026-03-31

思科推出统一AI网络架构应对训练与推理流量冲突

思科提出统一AI网络架构解决方案，通过N9000系列交换机实现训练和推理流量的智能调度，解决传统双架构模式下的资源浪费问题。该方案包含硅级低延迟支持、实时遥测和自动化策略调整能力，瞄准新兴云服务商的平台化转型需求。

NVIDIA 其他强信号 2026-03-31

NVIDIA联合能源厂商推动AI工厂成为智能电网资产

NVIDIA与能源软件公司Emerald AI合作，提出将大型AI数据中心（AI工厂）从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制，旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作，以支持AI负载并加速电力接入。

NVIDIA 其他强信号 2026-03-31

NVIDIA联合能源企业推进AI工厂与电网协同架构

NVIDIA与Emerald AI合作推出将AI工厂作为智能电网资产的新架构，整合加速计算、实时能源调度和参考设计，使大规模AI部署能动态响应电网需求。该方案基于Vera Rubin DSX参考设计和Conductor平台，已获多家能源企业支持实施。

Amazon 其他中信号 2026-03-30

AWS与TGS达成战略合作，推动能源行业AI与HPC转型

TGS选择AWS作为首选云提供商，利用AWS的高性能计算和生成式AI构建能源勘探解决方案。合作包括现代化TGS Imaging AnyWare平台，部署多模态地下基础模型，并利用AWS Nitro系统确保工作负载安全。

Cisco 其他中信号 2026-03-27

思科推出Nexus Hyperfabric AI方案，集成800G交换机与HGX B300 GPU

思科发布Nexus Hyperfabric AI基础设施方案，整合800G以太网交换机和NVIDIA HGX B300 GPU，提供全栈预集成或灵活的'自带'模式。该方案符合NVIDIA Cloud Partner计划，旨在简化AI基础设施部署与运维。

Nokia 其他强信号 2026-03-26

诺基亚与Stelia合作，将开放网络与AI平台集成以支持分布式AI

诺基亚与AI平台公司Stelia建立合作，旨在将基于开放标准的网络技术与企业级AI平台深度集成。此举旨在解决生产级AI在分布式环境中部署时面临的性能、治理和安全挑战，确保高吞吐、低延迟的数据流。

Intel 其他中信号 2026-03-26

英特尔与CrowdStrike深化AI PC安全集成，优化端侧威胁检测

英特尔与CrowdStrike扩展合作，将Falcon平台深度集成至英特尔AI PC硬件层，利用CPU、GPU、NPU的端侧AI加速能力及芯片级遥测技术。该方案旨在实现实时威胁检测与入侵防御，同时避免性能损耗，针对生成式AI数据泄露风险提供企业级防护。

NVIDIA 其他强信号 2026-03-25

英伟达联合能源机构展示AI算力工厂参与电网调峰

英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作，成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求，动态调节自身功耗以充当电网的“减震器”，同时保障高优先级AI工作负载的性能。

NVIDIA 其他中信号 2026-03-25

英伟达与Emerald AI展示AI工厂动态能耗调节能力

英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应，通过NVIDIA System Management Interface获取秒级功耗数据，Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。

情报

筛选