筛选

×
当前筛选 清除全部
关键词: 推理 ×
147 情报总数
4/8 当前页
Ericsson 其他 中信号 2026-03-25

爱立信联合研究机构开发6G AI网络感知与优化技术

爱立信与于利希研究中心合作开发6G人工智能技术,重点研究神经形态计算和量子计算在网络感知与优化中的应用。该合作旨在解决6G网络复杂性、能效和实时数据处理挑战,探索超越传统架构的新型计算范式。

ARM 其他 强信号 2026-03-25

Arm推出自研AGI CPU进军AI数据中心硬件市场

Arm首次推出自研硅产品AGI CPU,专为AI数据中心设计,采用Neoverse V3架构,单机架性能宣称超x86平台2倍以上。该产品标志着Arm从IP授权商向硅产品供应商的战略转型,已获得Meta、OpenAI等关键客户支持。

Cisco 其他 中信号 2026-03-23

思科与Digital Realty推出统一AI基础设施方案

思科与Digital Realty合作推出预验证的AI基础设施参考架构,整合8000系列路由器、SRv6网络技术和AI安全方案,支持20-50kW高密度POD部署。该方案通过Digital Realty的全球数据中心平台提供分布式AI推理能力,旨在简化企业AI规模化部署。

NVIDIA 其他 强信号 2026-03-21

NVIDIA Blackwell架构实现25倍能效提升

NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。

NVIDIA 其他 中信号 2026-03-20

NVIDIA将RTX AI能力延伸至本地Agentic AI,加速Gemma 4推理

NVIDIA在GTC 2026上宣布,正将其RTX平台的能力扩展至本地Agentic AI领域,旨在加速Gemma 4等开放模型在终端设备上的推理性能。此举旨在利用本地实时上下文提升AI Agent的价值,推动云端之外的AI创新。

AMD 其他 中信号 2026-03-19

AMD与Celestica合作推出机架级AI平台Helios

AMD与电子制造服务商Celestica合作推出Helios机架级AI平台,集成Instinct加速器和EPYC处理器,提供从芯片到机架级的整体优化。该平台针对AI训练和推理任务进行性能与能效优化,旨在满足数据中心和云服务提供商的AI算力需求。

AMD 其他 中信号 2026-03-19

AMD 强调 CPU 在 Agentic AI 编排与推理中的关键作用

AMD 提出 Agentic AI 工作负载依赖串行决策和上下文管理,更适合 CPU 处理。公司强调高核心数、大内存带宽的服务器 CPU 将主导智能体编排和轻量级推理,补充 GPU 在训练中的角色。这反映了 CPU 在 AI 数据中心架构中的战略重新定位。

AMD 其他 中信号 2026-03-19

AMD与Upstage合作推出基于MI325X的主权AI基础设施方案

AMD与韩国AI公司Upstage深化合作,基于Instinct MI325X加速器构建主权AI基础设施解决方案。通过优化ROCm软件栈实现Solar LLM与硬件平台深度集成,提升AI训练和推理效率。该方案针对韩国市场数据主权要求提供本地化AI算力。

Amazon 其他 强信号 2026-03-19

AWS与Cerebras推出推理解耦架构优化AI推理性能

AWS与Cerebras合作推出基于Trainium和CS-3的异构推理方案,采用计算与内存阶段解耦架构,通过EFA网络互连。该方案针对交互式AI应用优化,声称性能提升一个数量级,部署于Nitro安全环境。

Amazon 其他 中信号 2026-03-19

Parrot Analytics 部署 Amazon Bedrock AgentCore 实现高吞吐代理编排

Parrot Analytics 集成 Amazon Bedrock AgentCore 和 Amazon Nova 模型,实现 25 TPS 持续代理调用吞吐,构建媒体行业智能操作系统。通过专有数据与 AWS AI 基础设施结合,支持批量 AI 工作负载编排。该架构旨在推动媒体行业从回顾性测量转向预测性资本分配。

Cisco 其他 中信号 2026-03-18

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU,支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化,可实时分配PCIe GPU资源。该方案提供验证设计蓝图,加速AI推理、视觉AI等多工作负载的规模化部署。

NVIDIA 其他 强信号 2026-03-18

英伟达与电信运营商共建AI网格,重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

NVIDIA 其他 强信号 2026-03-18

NVIDIA联合电信运营商构建分布式AI推理网格

NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。

Samsung Electronics 其他 中信号 2026-03-18

三星与AMD深化AI硬件合作,提供HBM4内存与代工服务

三星将成为AMD下一代MI455X GPU的HBM4主要供应商,提供13Gbps带宽的高性能内存。双方还将合作开发针对第6代EPYC CPU的DDR5解决方案,并探讨三星为AMD提供代工服务的机会。

Google 其他 中信号 2026-03-18

Google DeepMind 发布 AGI 认知评估框架并启动黑客松

Google DeepMind 提出基于认知科学的 AGI 评估框架,定义 10 项关键认知能力并设计三阶段评估协议。通过 Kaggle 黑客松众包开发五项核心能力的评估方案,旨在建立标准化 AGI 评测体系。

Google 其他 中信号 2026-03-18

谷歌Gemini API简化智能体编排架构

谷歌Gemini API更新支持单请求内联自定义与内置工具,新增工具间上下文循环功能,降低智能体应用开发复杂度。为Gemini 3模型扩展Google地图基础功能,引入工具调用唯一ID提升可调试性。

HPE 其他 强信号 2026-03-17

HPE联合NVIDIA推出AI Grid,构建分布式推理统一网格

HPE在NVIDIA GTC上发布AI Grid解决方案,基于NVIDIA参考架构,旨在将分布式的AI工厂和推理集群安全连接成一个统一的智能系统。该方案帮助服务提供商大规模部署和管理边缘推理站点,以满足AI原生应用对低延迟、可预测基础设施的需求。

OpenAI 其他 中信号 2026-03-17

OpenAI发布小型化模型GPT-5.4 mini/nano优化企业AI推理

OpenAI推出GPT-5.4 mini和nano两款小型化模型,针对编码、多模态和高吞吐API场景优化。模型通过减小体积提升推理速度,降低企业部署成本。这代表OpenAI通过模型优化战略强化企业级AI服务竞争力。

NVIDIA 其他 强信号 2026-03-17

NVIDIA AI网格:AT&T、T-Mobile等共建分布式AI推理平台

NVIDIA在GTC 2026上宣布AI网格战略,电信运营商将现有网络基础设施转化为地理分布式AI推理平台。AT&T、T-Mobile、Comcast、Spectrum、Akamai等主要运营商参与,共建分布式边缘AI基础设施。AI网格通过在网络边缘部署推理能力,实现更低延迟和更优Token成本。

NVIDIA 其他 强信号 2026-03-17

NVIDIA量产Dynamo 1.0推理操作系统,强化AI工厂软件平台战略

NVIDIA开始量产AI推理操作系统Dynamo 1.0,提供统一软件层协调跨数据中心、云和边缘的AI推理工作负载。该系统通过标准化运行时和调度器简化大规模AI模型部署,将基础设施管理抽象化。