memory - AI基础设施情报搜索

ASML 其他 2026-06-21

美光HBM4量产锁定AI内存带宽新基线，GPU集群设计被迫重构

美光宣布HBM4进入大批量生产，每芯片36GB、12层堆叠，带宽超过2.8TB/s（HBM3E的2.3倍），功耗降低20%。2026年全部产能已被预订，同时预览PCIe Gen6 SSD。此举将AI内存瓶颈从容量转向带宽，迫使超大规模数据中心重新评估GPU互连架构。

Cloudflare 其他 2026-06-21

SPHBM4标准化：打破CoWoS瓶颈，AI封装民主化与供应链重塑

JEDEC即将推出的SPHBM4标准通过4:1串行化将HBM4接口宽度从2048引脚降至512引脚，从而允许直接安装在有机或玻璃基板上，彻底绕开TSMC CoWoS硅中介层。此举将AI封装从稀缺的晶圆厂服务转变为多供应商竞争生态，降低部署成本并加速产能扩张。

ASML 其他 2026-06-20

美光停售消费内存：AI算力饥渴驱动产能重新分配，数据中心优先锁定

美光于2026年2月停止向零售渠道交付Crucial品牌消费级内存，将产能全面转向AI数据中心客户，并确认与Nvidia Vera-Rubin平台相关的内存模组生产计划。此举旨在将内存从商品化输入重塑为AI基础设施的关键使能器。

Cloudflare 其他 2026-06-20

AXT融资6.3亿美元扩产磷化铟：AI光互连瓶颈的供应商战略冲刺

AXT完成6.325亿美元融资，计划2026年将磷化铟产能翻倍，并加速6英寸晶圆商业化。公司正与超大规模客户直接接触，共封装光学(CPO)被视为2027年后的下一拐点。中国需求激增，但出口许可仍是主要不确定性。

Cloudflare 其他 2026-06-19

小鹏放弃数十亿ADAS系统，全面押注VLA基础模型与物理AI

小鹏汽车创始人何小鹏透露，公司已放弃耗资数十亿的基于软件规则与AI算法的ADAS系统，转向基于统一VLA基础模型的物理AI架构，旨在突破自动驾驶上限并拓展至人形机器人领域。

NVIDIA 其他 2026-06-18

CXMT国产24Gb DDR5量产，中国内存供应链实现关键自主

中国品牌Gloway和KingBank开始在消费级内存套件中使用国产CXMT 24Gb DDR5芯片，实现48GB双通道容量。此举标志着中国在DRAM领域摆脱对美韩巨头的依赖，但初期速度限制在6000 MT/s，密度提升但高速性能仍有差距。

ASML 其他 2026-06-18

AMD收购MEXT实现NAND闪存模拟DRAM，AI推理内存成本腰斩

AMD完成对MEXT的收购，其技术使廉价NAND闪存模拟DRAM行为，将可用内存容量提升2-4倍同时成本减半。该能力被直接瞄准AI推理和代理型AI市场，解决内存带宽瓶颈。同时AMD与Rackspace签署30MW AI计算部署协议，2026-2028年落地。

MediaTek 其他 2026-06-18

苹果押注英特尔18A：代工生态重构与地缘政治保险

苹果与英特尔达成芯片代工合作，将使用英特尔最先进的**18A-P**（风险生产）及后续**14A**节点在美国本土生产芯片。此举既是对英特尔代工能力的最高认可，也是苹果应对台积电产能紧张（英伟达占据60% CoWoS产能）和台湾地缘政治风险的关键战略转移。

NVIDIA 其他 2026-06-18

AMD悄然移除消费级Ryzen TSME：安全功能分化锁定企业客户

AMD在未公开声明的情况下，从基于Zen 5的消费级Ryzen处理器中移除了Transparent Secure Memory Encryption (TSME)功能，仅保留给Ryzen PRO系列。该变化始于AGESA 1.2.7.0固件，用户难以在Windows上察觉，但Linux系统可检测到缺失。此举旨在通过安全功能差异化，推动企业用户转向更高价格的PRO产品线。

AMD 其他 2026-06-17

AMD Threadripper 'Mustang Peak' 曝光：144核、PCIe 6.0、新TR6插槽，但功耗内存瓶颈暗藏

AMD Zen 6 Threadripper Pro 'Mustang Peak' 确认采用2nm工艺、DDR5、PCIe 6.0及全新TR6插槽。基于Powderhorn CCD，核心数最高可达144核（288线程），频率超6GHz。但功耗巨大，内存带宽可能依赖MRDIMM，平台升级成本高昂。

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

Google Cloud 其他 2026-06-17

AI Hits the Office - Mesoclever

AI Hits the Office Posted on June 17, 2026 by zar { "@context": "https://schema.org", "@type": "Article", "headline": "AI Hits the Off...

Google Cloud 其他 2026-06-17

Google Cloud 为 AI Agent 嵌入法律可验证身份，监管驱动架构重构

Google Cloud 为 Gemini Enterprise 和 Vertex AI Agent Engine 引入基于 SPIFFE 的 Agent Identity，并集成 Kakunin 的合规层，将内部 SPIFFE 标识映射为 AWS KMS 生成的 X.509 证书，所有状态变更写入 WORM 审计日志。此举将运行时安全升级为法律可审计的市场参与者身份，以应对 EU AI Act 和 MiCA 的问责要求。

Cisco 其他 2026-06-17

Cisco AI Defense推出Agent Harness专项红队测试，填补Agent安全评估空白

Cisco在AI Defense: Explorer Edition中引入Agent Validation功能，专门针对Agent Harness的独特攻击面（工具路由、间接内容通道、跨会话持久状态）进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证，填补了传统对话式安全评估在Agent场景下的空白。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-16

Lexar用SSD卸载AI模型：DRAM成本降低40%，但延迟问题未解

Lexar发布AI Storage Core SSD，通过自研SPU DRAM-less控制器和软件栈，将大语言模型卸载到NAND Flash，使Qwen 3.5 122B模型在32GB DRAM上运行，速度达15.6 tokens/s，相比传统方案提升3倍，但首次token延迟（TTFM）达2-8秒，限制了实时交互场景。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

MediaTek 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

Google Cloud 其他 2026-06-16

Apple联手Google Gemini重塑Siri：AI模型外包，硬件支持大幅收缩

Apple宣布基于Google Gemini技术重建Siri，推出五个新AFM 3基础模型，其中20B参数多模态模型为最强端侧选项。同时watchOS 27仅支持S9/S10芯片，大幅削减旧设备支持，加速AI功能与硬件绑定，标志着生态位从完全自研转向混合合作。

情报

筛选