筛选

×
当前筛选 清除全部
关键词: 架构 ×
289 情报总数
15/15 当前页
Intel 其他 2025-06-02

Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态

Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。

NVIDIA 其他 2025-06-01

NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC

NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。

Microsoft 其他 2025-04-10

微软发布季度财报日期,未披露技术架构或战略变化

微软宣布了其2025财年第三季度的财报发布日期,该信息仅为财务日程公告,未包含任何关于AI基础设施、企业网络、安全或产品战略的新技术细节或架构变化。

Microsoft 其他 2025-03-18

微软回应TRC Capital迷你收购要约,无技术架构或战略变化

微软发布声明,回应TRC Capital以低于市价发起的迷你收购要约,建议股东不要接受。该公告为常规公司财务与股东沟通,不涉及任何技术产品发布、架构演进或战略方向调整。

Microsoft 其他 中信号 2025-02-27

微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。

NVIDIA 其他 1970-01-01

NVIDIA 200亿美元购Groq LPU:推理芯片从HBM转向片上SRAM

NVIDIA与Groq达成约200亿美元技术许可协议,获取LPU(Language Processing Unit)核心技术与团队。LPU采用230MB片上SRAM,带宽80TB/s,专为Transformer推理解码优化,替代传统GPU的HBM瓶颈,重塑AI推理芯片格局。

Huawei 其他 1970-01-01

华为昇腾910C完成1.6万亿参数训练:国产算力首次突破MoE全流程

华为联合河套学院等机构,基于昇腾910C集群完成DeepSeek-V4-Pro(1.6万亿参数MoE架构)全参数后训练。核心数据:千卡集群稳定1500步,算力利用率30%,算子效率提升14%,全程无海外GPU依赖,标志着国产算力首次实现万亿级大模型完整训练闭环。

NVIDIA 其他 1970-01-01

英伟达吞下Groq LPU:Feynman GPU融合SRAM推理单元,混合架构加速2028

英伟达通过非排他许可与逆向招安获取Groq的LPU推理技术,计划在2028年Feynman GPU中采用台积电SoIC混合键合集成大容量SRAM芯片块,实现确定性调度与80TB/s片上带宽,从纯GPU供应商向混合推理/训练平台转型。

Research 其他 1970-01-01

智谱GLM-5.2开源:MIT协议744B MoE,以可下载模型对抗地缘政治禁运

智谱AI发布GLM-5.2,744B MoE仅40B激活参数,支持1M输入上下文和131K输出,采用MIT开源协议。时间点紧贴Anthropic Fable 5被美国政府强制下架,提供可下载、不可被禁的替代方案,兼容Anthropic API实现零代码迁移,旨在为企业提供技术主权选项。