推理芯片 - AI基础设施情报搜索

TSMC 其他 2026-06-17

...

Google Cloud 其他 2026-06-15

Google Cloud推出第八代TPU，将训练芯片TPU8t与推理芯片TPU8i分离，训练Pod级性能提升3倍，推理美元当量性能提升80%。同时Vertex AI进化为Gemini Enterprise Agent Platform，结合Smals主权云合同，加速公共部门AI采纳。

Qualcomm 其他 2026-06-14

高通AI200推理芯片（768GB内存）预计2026年大规模部署于AWS，旨在降低云推理成本。此举标志着高通从移动端向云数据中心的关键战略转移，并借助AWS定制化芯片战略，直接挑战英伟达在AI推理环节的垄断地位，重构云推理芯片生态联盟。

Microsoft Azure 产品发布 2026-06-03

微软在Build 2026宣布Maia 200 AI推理芯片量产，Cobalt 200 ARM处理器预览，并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈，意图在推理环节降低对NVIDIA GPU的依赖，并锁定Azure AI工作负载。

Amazon 其他强信号 2026-02-28

亚马逊推出第二代AI推理芯片Inferentia2，专为Transformer模型设计，性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例，通过UltraClusters架构支持大规模集群部署，提供比GPU实例高40%的性价比和低50%能耗。

NVIDIA 其他 1970-01-01

NVIDIA与Groq达成约200亿美元技术许可协议，获取LPU（Language Processing Unit）核心技术与团队。LPU采用230MB片上SRAM，带宽80TB/s，专为Transformer推理解码优化，替代传统GPU的HBM瓶颈，重塑AI推理芯片格局。

情报