推理 - AI基础设施情报搜索

Ericsson 其他中信号 2026-03-25

爱立信联合研究机构开发6G AI网络感知与优化技术

爱立信与于利希研究中心合作开发6G人工智能技术，重点研究神经形态计算和量子计算在网络感知与优化中的应用。该合作旨在解决6G网络复杂性、能效和实时数据处理挑战，探索超越传统架构的新型计算范式。

ARM 其他强信号 2026-03-25

Arm推出自研AGI CPU进军AI数据中心硬件市场

Arm首次推出自研硅产品AGI CPU，专为AI数据中心设计，采用Neoverse V3架构，单机架性能宣称超x86平台2倍以上。该产品标志着Arm从IP授权商向硅产品供应商的战略转型，已获得Meta、OpenAI等关键客户支持。

Cisco 其他中信号 2026-03-23

思科与Digital Realty推出统一AI基础设施方案

思科与Digital Realty合作推出预验证的AI基础设施参考架构，整合8000系列路由器、SRv6网络技术和AI安全方案，支持20-50kW高密度POD部署。该方案通过Digital Realty的全球数据中心平台提供分布式AI推理能力，旨在简化企业AI规模化部署。

NVIDIA 其他强信号 2026-03-21

NVIDIA Blackwell架构实现25倍能效提升

NVIDIA发布Blackwell GPU架构，通过Transformer引擎和NVLink互联技术创新，实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本，直接影响数据中心TCO和可持续性指标。

NVIDIA 其他中信号 2026-03-20

NVIDIA将RTX AI能力延伸至本地Agentic AI，加速Gemma 4推理

NVIDIA在GTC 2026上宣布，正将其RTX平台的能力扩展至本地Agentic AI领域，旨在加速Gemma 4等开放模型在终端设备上的推理性能。此举旨在利用本地实时上下文提升AI Agent的价值，推动云端之外的AI创新。

AMD 其他中信号 2026-03-19

AMD与Celestica合作推出机架级AI平台Helios

AMD与电子制造服务商Celestica合作推出Helios机架级AI平台，集成Instinct加速器和EPYC处理器，提供从芯片到机架级的整体优化。该平台针对AI训练和推理任务进行性能与能效优化，旨在满足数据中心和云服务提供商的AI算力需求。

AMD 其他中信号 2026-03-19

AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用

AMD 提出 Agentic AI 工作负载依赖串行决策和上下文管理，更适合 CPU 处理。公司强调高核心数、大内存带宽的服务器 CPU 将主导智能体编排和轻量级推理，补充 GPU 在训练中的角色。这反映了 CPU 在 AI 数据中心架构中的战略重新定位。

AMD 其他中信号 2026-03-19

AMD与Upstage合作推出基于MI325X的主权AI基础设施方案

AMD与韩国AI公司Upstage深化合作，基于Instinct MI325X加速器构建主权AI基础设施解决方案。通过优化ROCm软件栈实现Solar LLM与硬件平台深度集成，提升AI训练和推理效率。该方案针对韩国市场数据主权要求提供本地化AI算力。

Amazon 其他强信号 2026-03-19

AWS与Cerebras推出推理解耦架构优化AI推理性能

AWS与Cerebras合作推出基于Trainium和CS-3的异构推理方案，采用计算与内存阶段解耦架构，通过EFA网络互连。该方案针对交互式AI应用优化，声称性能提升一个数量级，部署于Nitro安全环境。

Amazon 其他中信号 2026-03-19

Parrot Analytics 部署 Amazon Bedrock AgentCore 实现高吞吐代理编排

Parrot Analytics 集成 Amazon Bedrock AgentCore 和 Amazon Nova 模型，实现 25 TPS 持续代理调用吞吐，构建媒体行业智能操作系统。通过专有数据与 AWS AI 基础设施结合，支持批量 AI 工作负载编排。该架构旨在推动媒体行业从回顾性测量转向预测性资本分配。

Cisco 其他中信号 2026-03-18

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU，支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化，可实时分配PCIe GPU资源。该方案提供验证设计蓝图，加速AI推理、视觉AI等多工作负载的规模化部署。

NVIDIA 其他强信号 2026-03-18

英伟达与电信运营商共建AI网格，重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作，将现有分布式网络站点（如中心局、基站）升级为“AI网格”，旨在将AI推理能力部署到网络边缘，以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

NVIDIA 其他强信号 2026-03-18

NVIDIA联合电信运营商构建分布式AI推理网格

NVIDIA与AT&T、Comcast等电信运营商合作，将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台，支持低延迟推理。该AI网格已在物联网、云游戏等场景验证，实现端到端低于500毫秒延迟和50%成本降低。

Samsung Electronics 其他中信号 2026-03-18

三星与AMD深化AI硬件合作，提供HBM4内存与代工服务

三星将成为AMD下一代MI455X GPU的HBM4主要供应商，提供13Gbps带宽的高性能内存。双方还将合作开发针对第6代EPYC CPU的DDR5解决方案，并探讨三星为AMD提供代工服务的机会。

Google 其他中信号 2026-03-18

Google DeepMind 发布 AGI 认知评估框架并启动黑客松

Google DeepMind 提出基于认知科学的 AGI 评估框架，定义 10 项关键认知能力并设计三阶段评估协议。通过 Kaggle 黑客松众包开发五项核心能力的评估方案，旨在建立标准化 AGI 评测体系。

Google 其他中信号 2026-03-18

谷歌Gemini API简化智能体编排架构

谷歌Gemini API更新支持单请求内联自定义与内置工具，新增工具间上下文循环功能，降低智能体应用开发复杂度。为Gemini 3模型扩展Google地图基础功能，引入工具调用唯一ID提升可调试性。

HPE 其他强信号 2026-03-17

HPE联合NVIDIA推出AI Grid，构建分布式推理统一网格

HPE在NVIDIA GTC上发布AI Grid解决方案，基于NVIDIA参考架构，旨在将分布式的AI工厂和推理集群安全连接成一个统一的智能系统。该方案帮助服务提供商大规模部署和管理边缘推理站点，以满足AI原生应用对低延迟、可预测基础设施的需求。

OpenAI 其他中信号 2026-03-17

OpenAI发布小型化模型GPT-5.4 mini/nano优化企业AI推理

OpenAI推出GPT-5.4 mini和nano两款小型化模型，针对编码、多模态和高吞吐API场景优化。模型通过减小体积提升推理速度，降低企业部署成本。这代表OpenAI通过模型优化战略强化企业级AI服务竞争力。

NVIDIA 其他强信号 2026-03-17

NVIDIA AI网格：AT&T、T-Mobile等共建分布式AI推理平台

NVIDIA在GTC 2026上宣布AI网格战略，电信运营商将现有网络基础设施转化为地理分布式AI推理平台。AT&T、T-Mobile、Comcast、Spectrum、Akamai等主要运营商参与，共建分布式边缘AI基础设施。AI网格通过在网络边缘部署推理能力，实现更低延迟和更优Token成本。

NVIDIA 其他强信号 2026-03-17

NVIDIA量产Dynamo 1.0推理操作系统，强化AI工厂软件平台战略

NVIDIA开始量产AI推理操作系统Dynamo 1.0，提供统一软件层协调跨数据中心、云和边缘的AI推理工作负载。该系统通过标准化运行时和调度器简化大规模AI模型部署，将基础设施管理抽象化。

情报

筛选

爱立信联合研究机构开发6G AI网络感知与优化技术

Arm推出自研AGI CPU进军AI数据中心硬件市场

思科与Digital Realty推出统一AI基础设施方案

NVIDIA Blackwell架构实现25倍能效提升

NVIDIA将RTX AI能力延伸至本地Agentic AI，加速Gemma 4推理

AMD与Celestica合作推出机架级AI平台Helios

AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用

AMD与Upstage合作推出基于MI325X的主权AI基础设施方案

AWS与Cerebras推出推理解耦架构优化AI推理性能

Parrot Analytics 部署 Amazon Bedrock AgentCore 实现高吞吐代理编排

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

英伟达与电信运营商共建AI网格，重构分布式推理基础设施

NVIDIA联合电信运营商构建分布式AI推理网格

三星与AMD深化AI硬件合作，提供HBM4内存与代工服务

Google DeepMind 发布 AGI 认知评估框架并启动黑客松

谷歌Gemini API简化智能体编排架构

HPE联合NVIDIA推出AI Grid，构建分布式推理统一网格

OpenAI发布小型化模型GPT-5.4 mini/nano优化企业AI推理

NVIDIA AI网格：AT&T、T-Mobile等共建分布式AI推理平台

NVIDIA量产Dynamo 1.0推理操作系统，强化AI工厂软件平台战略