情报
AI 生成的结构化厂商动态简报
美光HBM4量产锁定AI内存带宽新基线,GPU集群设计被迫重构
美光宣布HBM4进入大批量生产,每芯片36GB、12层堆叠,带宽超过2.8TB/s(HBM3E的2.3倍),功耗降低20%。2026年全部产能已被预订,同时预览PCIe Gen6 SSD。此举将AI内存瓶颈从容量转向带宽,迫使超大规模数据中心重新评估GPU互连架构。
SPHBM4标准化:打破CoWoS瓶颈,AI封装民主化与供应链重塑
JEDEC即将推出的SPHBM4标准通过4:1串行化将HBM4接口宽度从2048引脚降至512引脚,从而允许直接安装在有机或玻璃基板上,彻底绕开TSMC CoWoS硅中介层。此举将AI封装从稀缺的晶圆厂服务转变为多供应商竞争生态,降低部署成本并加速产能扩张。
美光停售消费内存:AI算力饥渴驱动产能重新分配,数据中心优先锁定
美光于2026年2月停止向零售渠道交付Crucial品牌消费级内存,将产能全面转向AI数据中心客户,并确认与Nvidia Vera-Rubin平台相关的内存模组生产计划。此举旨在将内存从商品化输入重塑为AI基础设施的关键使能器。
AXT融资6.3亿美元扩产磷化铟:AI光互连瓶颈的供应商战略冲刺
AXT完成6.325亿美元融资,计划2026年将磷化铟产能翻倍,并加速6英寸晶圆商业化。公司正与超大规模客户直接接触,共封装光学(CPO)被视为2027年后的下一拐点。中国需求激增,但出口许可仍是主要不确定性。
小鹏放弃数十亿ADAS系统,全面押注VLA基础模型与物理AI
小鹏汽车创始人何小鹏透露,公司已放弃耗资数十亿的基于软件规则与AI算法的ADAS系统,转向基于统一VLA基础模型的物理AI架构,旨在突破自动驾驶上限并拓展至人形机器人领域。
CXMT国产24Gb DDR5量产,中国内存供应链实现关键自主
中国品牌Gloway和KingBank开始在消费级内存套件中使用国产CXMT 24Gb DDR5芯片,实现48GB双通道容量。此举标志着中国在DRAM领域摆脱对美韩巨头的依赖,但初期速度限制在6000 MT/s,密度提升但高速性能仍有差距。
AMD收购MEXT实现NAND闪存模拟DRAM,AI推理内存成本腰斩
AMD完成对MEXT的收购,其技术使廉价NAND闪存模拟DRAM行为,将可用内存容量提升2-4倍同时成本减半。该能力被直接瞄准AI推理和代理型AI市场,解决内存带宽瓶颈。同时AMD与Rackspace签署30MW AI计算部署协议,2026-2028年落地。
苹果押注英特尔18A:代工生态重构与地缘政治保险
苹果与英特尔达成芯片代工合作,将使用英特尔最先进的**18A-P**(风险生产)及后续**14A**节点在美国本土生产芯片。此举既是对英特尔代工能力的最高认可,也是苹果应对台积电产能紧张(英伟达占据60% CoWoS产能)和台湾地缘政治风险的关键战略转移。
AMD悄然移除消费级Ryzen TSME:安全功能分化锁定企业客户
AMD在未公开声明的情况下,从基于Zen 5的消费级Ryzen处理器中移除了Transparent Secure Memory Encryption (TSME)功能,仅保留给Ryzen PRO系列。该变化始于AGESA 1.2.7.0固件,用户难以在Windows上察觉,但Linux系统可检测到缺失。此举旨在通过安全功能差异化,推动企业用户转向更高价格的PRO产品线。
AMD Threadripper 'Mustang Peak' 曝光:144核、PCIe 6.0、新TR6插槽,但功耗内存瓶颈暗藏
AMD Zen 6 Threadripper Pro 'Mustang Peak' 确认采用2nm工艺、DDR5、PCIe 6.0及全新TR6插槽。基于Powderhorn CCD,核心数最高可达144核(288线程),频率超6GHz。但功耗巨大,内存带宽可能依赖MRDIMM,平台升级成本高昂。
NVIDIA RTX Remix 1.5:用RTX IO压缩和AI Agent重塑游戏MOD生态,强化GPU锁定
NVIDIA发布RTX Remix 1.5更新,核心亮点是引入RTX IO技术,将《半条命2 RTX》文件大小从80GB压缩至50GB,并降低CPU开销。同时,新增AI Agent集成(RTX Remix Skills),允许AI编码代理自动执行复杂的MOD制作步骤,降低非程序员用户的入门门槛。
AI Hits the Office - Mesoclever
AI Hits the Office Posted on June 17, 2026 by zar { "@context": "https://schema.org", "@type": "Article", "headline": "AI Hits the Off...
Google Cloud 为 AI Agent 嵌入法律可验证身份,监管驱动架构重构
Google Cloud 为 Gemini Enterprise 和 Vertex AI Agent Engine 引入基于 SPIFFE 的 Agent Identity,并集成 Kakunin 的合规层,将内部 SPIFFE 标识映射为 AWS KMS 生成的 X.509 证书,所有状态变更写入 WORM 审计日志。此举将运行时安全升级为法律可审计的市场参与者身份,以应对 EU AI Act 和 MiCA 的问责要求。
Cisco AI Defense推出Agent Harness专项红队测试,填补Agent安全评估空白
Cisco在AI Defense: Explorer Edition中引入Agent Validation功能,专门针对Agent Harness的独特攻击面(工具路由、间接内容通道、跨会话持久状态)进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证,填补了传统对话式安全评估在Agent场景下的空白。
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
Lexar用SSD卸载AI模型:DRAM成本降低40%,但延迟问题未解
Lexar发布AI Storage Core SSD,通过自研SPU DRAM-less控制器和软件栈,将大语言模型卸载到NAND Flash,使Qwen 3.5 122B模型在32GB DRAM上运行,速度达15.6 tokens/s,相比传统方案提升3倍,但首次token延迟(TTFM)达2-8秒,限制了实时交互场景。
NVIDIA Blackwell MLPerf六连冠:NVLink与NVFP4定义AI训练新范式
NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先,首次提交所有7个基准测试,包括MoE模型。GB300 NVL72比GB200快1.6x,通过第五代NVLink实现72 GPU一体化,NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。
HBM成AI新瓶颈:亚洲内存厂商夺回供应链控制权,Nvidia成本占比升至90%
SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力,市值突破万亿美元,而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。
AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构
AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。
Apple联手Google Gemini重塑Siri:AI模型外包,硬件支持大幅收缩
Apple宣布基于Google Gemini技术重建Siri,推出五个新AFM 3基础模型,其中20B参数多模态模型为最强端侧选项。同时watchOS 27仅支持S9/S10芯片,大幅削减旧设备支持,加速AI功能与硬件绑定,标志着生态位从完全自研转向混合合作。