推理 - AI基础设施情报搜索

Amazon 合作伙伴强信号 2026-04-15

AWS与OpenAI签署380亿美元AI云合作

OpenAI与AWS签署7年期380亿美元协议，部署数千块NVIDIA GB200/GB300 GPU。OpenAI首次重大多元化Azure基础设施。

Meta 其他强信号 2026-04-14

Meta与Broadcom达成多年2nm AI芯片合作，初始部署超1GW

Meta与Broadcom宣布多年多代战略合作，共同开发MTIA（Meta Training and Inference Accelerator）芯片，合作延续至2029年。首批部署超过1GW，后续扩展至数吉瓦级别。这是业界首个2nm工艺AI计算加速器，基于Broadcom XPU平台深度定制。Meta已规划MTIA 300/400/450/500四个迭代版本，主要用于推荐算法、内容排序和大规模AI推理。Broadcom CEO陈福阳将退出Meta董事会以规避利益关联，转为战略顾问。

Google 产品发布中信号 2026-04-09

Google Cloud Next 2026：企业AI代理平台"登堂入室"的标志性时刻

Google Cloud Next 2026代表了AI平台竞争的"登堂入室"时刻。Gemini Enterprise Agent Platform的发布表明，大型云厂商已从"提供AI能力"转向"提供AI工作流"。平台捆绑战正式开打，企业需要在"功能完整性"和"供应商锁定风险"之间做出选择。

Meta 其他强信号 2026-04-08

Meta发布Muse Spark基础模型并重构AI助手架构

Meta推出其Superintelligence Labs的首个模型Muse Spark，并以此为核心全面升级Meta AI助手。新架构支持并行子代理（subagents）协同推理、强大的多模态感知能力，并能调用社交图谱内容提供个性化答案。

Intel 其他强信号 2026-04-08

英特尔与SambaNova联合发布面向Agentic AI的异构推理架构

英特尔与SambaNova宣布合作，为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器，旨在解决性能、效率与软件兼容性挑战，预计2026年下半年推出。

Anthropic 其他强信号 2026-04-06

Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力

Anthropic宣布与谷歌及博通达成新协议，锁定数千兆瓦的下一代TPU算力，预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理，并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。

NVIDIA 其他强信号 2026-04-03

英伟达联合谷歌优化Gemma 4，强化本地AI代理基础设施

英伟达宣布与谷歌合作，针对其RTX、DGX Spark及Jetson平台，对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站，为本地AI代理（Agentic AI）提供从2B到31B参数的全栈模型支持。

NVIDIA 其他中信号 2026-04-03

NVIDIA 优化 Gemma 4 模型以加速本地代理 AI

NVIDIA 与 Google 合作优化 Gemma 4 系列模型，使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务，包括推理、编码和代理功能，适用于本地代理 AI 应用。

Google 其他强信号 2026-04-03

谷歌为Gemini API引入Flex与Priority推理层级

谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级，为延迟容忍型工作负载提供同步接口，价格降低50%；Priority为高可靠性层级，确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面，让开发者根据AI任务类型（如后台Agent思考与前台交互）灵活平衡成本与可靠性。

Google 其他强信号 2026-04-03

谷歌发布Gemma 4开源模型，瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族，包含从2B到31B的四个版本，强调单位参数性能突破，并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化，旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他中信号 2026-04-03

Google为Gemini API推出Flex和Priority推理层级

Google在其Gemini API中新增Flex和Priority两个服务层级，允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约，而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。

Cisco 其他中信号 2026-04-02

思科推出AI就绪宽带解决方案应对边缘计算挑战

思科发布Agile Services Networking和Unified Edge平台，旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力，减少核心网络负载，并支持智能流量优先级管理。

AMD 其他中信号 2026-04-02

AMD 在 MLPerf 推理测试中取得突破性成绩

AMD 宣布其 Instinct MI300X 加速器在 MLPerf Inference 6.0 基准测试中表现优异，特别是在自然语言处理任务上创下新纪录。这表明 AMD 在 AI 推理基础设施领域的技术竞争力显著提升。

Intel 其他中信号 2026-04-01

英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能

英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能，特别是在处理大型语言模型（LLM）时的表现。测试结果显示，配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型，并在多GPU设置中提供高达1.8倍的推理性能提升。

Cisco 其他强信号 2026-03-31

思科推出统一AI网络架构应对训练与推理流量冲突

思科提出统一AI网络架构解决方案，通过N9000系列交换机实现训练和推理流量的智能调度，解决传统双架构模式下的资源浪费问题。该方案包含硅级低延迟支持、实时遥测和自动化策略调整能力，瞄准新兴云服务商的平台化转型需求。

OpenAI 其他强信号 2026-03-31

OpenAI 融资1220亿美元加速全球AI基础设施建设

OpenAI宣布获得1220亿美元融资，将用于扩展全球前沿AI能力、投资下一代计算基础设施，并满足ChatGPT、Codex和企业级AI的快速增长需求。这笔创纪录融资将显著提升其AI训练集群和推理基础设施的建设规模。

NVIDIA 其他中信号 2026-03-31

NVIDIA 通过 NVLink Fusion 扩展 AI 生态系统

NVIDIA 宣布 Marvell 加入其 AI 生态系统，通过 NVLink Fusion 技术实现更高效的 AI 计算互连。这一合作将提升大规模 AI 训练和推理场景下的数据传输效率。

NVIDIA 其他强信号 2026-03-26

NVIDIA发布物理AI数据工厂蓝图及前沿模型

NVIDIA在GTC 2026发布三大物理AI前沿模型和Physical AI Data Factory开放参考架构，通过Cosmos世界模型和OSMO操作符将计算转化为合成训练数据。同时推出Omniverse DSX数字孪生仿真蓝图，工业机器人厂商正采用该框架验证应用并集成Jetson模块实现实时AI推理。

Cisco 其他中信号 2026-03-26

思科推出统一边缘平台推动医疗AI本地推理合规部署

思科推出Unified Edge统一边缘平台，支持医疗AI模型在数据源端进行本地推理，确保数据驻留临床环境内。该平台提供集中治理能力，实现低延迟诊断与合规要求平衡。合作伙伴案例显示可将心脏MRI分析时间从1小时缩短至10分钟。

Intel 其他中信号 2026-03-25

英特尔发布18A制程商用PC平台，强化AI推理能力

英特尔发布基于18A制程的酷睿Ultra 3系列商用PC处理器，AI性能较前代提升4倍。同步推出Arc Pro B70独立显卡，针对企业AI工作负载优化，在上下文窗口和多用户响应方面优于竞品。vPro平台与Intune深度集成提升企业设备管理效率。

情报

筛选