情报
AI 生成的结构化厂商动态简报
TSMC
其他
2026-06-17
台积电首次公开CoWoS玻璃基板开发计划
...
Google Cloud
其他
2026-06-15
Google TPU 8代训练推理芯片分离,AI基础设施性价比拐点到来
Google Cloud推出第八代TPU,将训练芯片TPU8t与推理芯片TPU8i分离,训练Pod级性能提升3倍,推理美元当量性能提升80%。同时Vertex AI进化为Gemini Enterprise Agent Platform,结合Smals主权云合同,加速公共部门AI采纳。
Qualcomm
其他
2026-06-14
高通AI200借AWS入云:推理芯片生态从英伟达独走向多元联盟
高通AI200推理芯片(768GB内存)预计2026年大规模部署于AWS,旨在降低云推理成本。此举标志着高通从移动端向云数据中心的关键战略转移,并借助AWS定制化芯片战略,直接挑战英伟达在AI推理环节的垄断地位,重构云推理芯片生态联盟。
Microsoft Azure
产品发布
2026-06-03
微软Maia 200量产+Cobalt 200预览:自研双芯合围NVIDIA,AI推理控制权转移
微软在Build 2026宣布Maia 200 AI推理芯片量产,Cobalt 200 ARM处理器预览,并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈,意图在推理环节降低对NVIDIA GPU的依赖,并锁定Azure AI工作负载。
Amazon
其他
强信号
2026-02-28
AWS发布Inferentia2推理芯片优化生成式AI基础设施
亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。
NVIDIA
其他
1970-01-01
NVIDIA 200亿美元购Groq LPU:推理芯片从HBM转向片上SRAM
NVIDIA与Groq达成约200亿美元技术许可协议,获取LPU(Language Processing Unit)核心技术与团队。LPU采用230MB片上SRAM,带宽80TB/s,专为Transformer推理解码优化,替代传统GPU的HBM瓶颈,重塑AI推理芯片格局。