Filter

×
当前筛选 清除全部
关键词: inference ×
93 情报总数
3/5 当前页
AMD Other 强信号 2026-04-27

AMD将边缘AI架构扩展至太空,定义轨道计算新范式

AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。

AMD Other 强信号 2026-04-27

AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施

AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。

NVIDIA Other 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

NVIDIA Other 强信号 2026-04-22

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。

Google Other 强信号 2026-04-22

Google发布Gemini企业级代理平台,定义AI代理时代技术栈

Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。

Anthropic Other 强信号 2026-04-21

Anthropic与AWS签署千亿美元协议锁定未来十年AI算力

Anthropic与亚马逊AWS签署新协议,承诺未来十年投入超1000亿美元,锁定高达5吉瓦的AI算力容量,并计划将Claude平台深度集成至AWS。此举旨在应对其AI模型Claude的爆炸性需求增长,并巩固其作为AWS上关键AI模型提供商的地位。

Cisco Other 强信号 2026-04-16

思科携手英伟达,将网络升级为AI媒体处理的控制平面

思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。

Microsoft Other 强信号 2026-04-16

微软提前启用Fairwater超大规模AI数据中心,定义AI基础设施新标准

微软宣布其位于威斯康星州的Fairwater数据中心提前投入运营。该中心被定位为全球最强大的AI数据中心,集成了数十万个NVIDIA GB200 GPU,通过大规模光纤互连构成单一无缝集群,旨在为下一代AI模型训练和推理提供前所未有的算力规模。

NVIDIA Other 强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。

Cisco Other 强信号 2026-04-14

思科联合工业自动化厂商,推动工厂边缘成为统一AI计算平台

思科在汉诺威工业展上联合罗克韦尔自动化等厂商,提出工厂边缘正演变为一个集成了控制、可视化与AI推理的统一计算平台。其核心是通过Cisco Unified Edge架构,将传统孤立的PLC、HMI、SCADA与AI工作负载(如视觉检测、预测性维护)整合,实现从洞察到实时闭环行动的转变。

Meta Other 强信号 2026-04-14

Meta与Broadcom达成多年2nm AI芯片合作,初始部署超1GW

Meta与Broadcom宣布多年多代战略合作,共同开发MTIA(Meta Training and Inference Accelerator)芯片,合作延续至2029年。首批部署超过1GW,后续扩展至数吉瓦级别。这是业界首个2nm工艺AI计算加速器,基于Broadcom XPU平台深度定制。Meta已规划MTIA 300/400/450/500四个迭代版本,主要用于推荐算法、内容排序和大规模AI推理。Broadcom CEO陈福阳将退出Meta董事会以规避利益关联,转为战略顾问。

Intel Other 强信号 2026-04-13

英特尔联合诺基亚与戴尔推出面向远边缘的UPF专用设备

英特尔、诺基亚与戴尔在MWC 2026上预展了一款基于英特尔至强6 SoC的远边缘UPF设备。该方案旨在为电信运营商在空间与功耗受限的远边缘环境提供高性能、低功耗的5G核心网用户面处理能力,并集成了AI功能。

Intel Other 强信号 2026-04-09

英特尔与谷歌深化合作,共同定义异构AI基础设施核心

英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。

Intel Other 强信号 2026-04-09

英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施

英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。

Intel Other 强信号 2026-04-08

英特尔与SambaNova联合发布面向Agentic AI的异构推理架构

英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。

ARM Other 2026-04-07

Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养

Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。

NVIDIA Other 强信号 2026-04-05

NVIDIA推动物理AI在机器人领域的技术整合

NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。

NVIDIA Other 中信号 2026-04-03

NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能

NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。

ARM Other 强信号 2026-04-03

ARM联合Google优化Gemma 4设备端AI性能

ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。

NVIDIA Other 强信号 2026-04-03

英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施

英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。