架构 - AI基础设施情报搜索

Intel 其他 2025-06-02

Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI，正面挑战NVIDIA推理生态

Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台，以及全解耦推理服务Vector Core Compute，旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位，直接竞争NVIDIA的Vera Rubin NVL72。

NVIDIA 其他 2025-06-01

NVIDIA RTX Spark与Nemotron-3 Ultra：端侧AI控制权从云端下沉至个人PC

NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机（与联发科合作）及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片，提供1 PFLOPS本地AI算力，首次将大模型推理下沉至PC端，并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。

Microsoft 其他 2025-04-10

微软发布季度财报日期，未披露技术架构或战略变化

微软宣布了其2025财年第三季度的财报发布日期，该信息仅为财务日程公告，未包含任何关于AI基础设施、企业网络、安全或产品战略的新技术细节或架构变化。

Microsoft 其他 2025-03-18

微软回应TRC Capital迷你收购要约，无技术架构或战略变化

微软发布声明，回应TRC Capital以低于市价发起的迷你收购要约，建议股东不要接受。该公告为常规公司财务与股东沟通，不涉及任何技术产品发布、架构演进或战略方向调整。

Microsoft 其他中信号 2025-02-27

微软推出Phi-4系列小语言模型，强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM)，包括5.6B参数的Phi-4-multimodal模型，支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog，重点优化边缘设备上的AI推理能力。

NVIDIA 其他 1970-01-01

NVIDIA 200亿美元购Groq LPU：推理芯片从HBM转向片上SRAM

NVIDIA与Groq达成约200亿美元技术许可协议，获取LPU（Language Processing Unit）核心技术与团队。LPU采用230MB片上SRAM，带宽80TB/s，专为Transformer推理解码优化，替代传统GPU的HBM瓶颈，重塑AI推理芯片格局。

Huawei 其他 1970-01-01

华为昇腾910C完成1.6万亿参数训练：国产算力首次突破MoE全流程

华为联合河套学院等机构，基于昇腾910C集群完成DeepSeek-V4-Pro（1.6万亿参数MoE架构）全参数后训练。核心数据：千卡集群稳定1500步，算力利用率30%，算子效率提升14%，全程无海外GPU依赖，标志着国产算力首次实现万亿级大模型完整训练闭环。

NVIDIA 其他 1970-01-01

英伟达吞下Groq LPU：Feynman GPU融合SRAM推理单元，混合架构加速2028

英伟达通过非排他许可与逆向招安获取Groq的LPU推理技术，计划在2028年Feynman GPU中采用台积电SoIC混合键合集成大容量SRAM芯片块，实现确定性调度与80TB/s片上带宽，从纯GPU供应商向混合推理/训练平台转型。

Research 其他 1970-01-01

智谱GLM-5.2开源：MIT协议744B MoE，以可下载模型对抗地缘政治禁运

智谱AI发布GLM-5.2，744B MoE仅40B激活参数，支持1M输入上下文和131K输出，采用MIT开源协议。时间点紧贴Anthropic Fable 5被美国政府强制下架，提供可下载、不可被禁的替代方案，兼容Anthropic API实现零代码迁移，旨在为企业提供技术主权选项。

情报

筛选