情报
AI 生成的结构化厂商动态简报
AMD发布CDNA 4架构加速卡MI430X强化AI算力
AMD发布基于CDNA 4架构的Instinct MI430X加速卡,集成增强矩阵核心和FP8精度支持,针对大语言模型训练和推理优化。采用HBM3e内存和Infinity Fabric互连技术,提升AI工作负载性能与能效。
AWS发布Inferentia2推理芯片优化生成式AI基础设施
亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。
三星强化移动AI安全与隐私保护能力
三星发布Galaxy S26系列,集成定制骁龙8 Elite Gen 5芯片提升AI算力,并首次在手机中内置隐私显示屏技术。安全层面强化Knox平台,新增后量子密码学保护并承诺七年安全更新。
Meta与AMD达成6GW AI基础设施战略合作
Meta宣布与AMD达成多年期战略合作,将部署高达6GW的AMD Instinct GPU计算能力。双方将基于AMD GPU、EPYC CPU和共同开发的Helios机架架构进行多代深度整合,支持Meta的多元化计算战略。首批部署计划于2026年下半年开始。
思科联合NVIDIA推出澳大利亚首个主权AI工厂
思科与Sharon AI合作,在澳大利亚部署基于1024个NVIDIA Blackwell Ultra GPU的AI工厂,整合UCS服务器、Nexus Hyperfabric和VAST Data存储,提供境内数据处理的AI基础设施。
三星通过Perplexity集成扩展Galaxy AI多智能体生态系统
三星宣布在Galaxy设备中深度集成Perplexity作为新AI智能体,通过系统级协调架构实现多应用无缝协作。该方案采用语音唤醒和框架级连接,减少用户手动切换,提升多步骤工作流效率。
英伟达调查显示电信网络AI自动化投资回报显著增长
英伟达发布电信行业AI应用调查报告,显示AI正成为网络自动化核心驱动力。调查预测到2026年电信运营商将获得显著投资回报,主要应用于网络流量预测、故障诊断和能源效率优化。高性能计算基础设施需求增长推动GPU加速和专用AI平台投资。
AWS Project Rainier上线:50万Trainium2芯片训练Claude
AWS Project Rainier激活,近50万颗Trainium2芯片成为全球最大非NVIDIA AI训练集群。Claude训练算力提升5倍。投资80亿美元。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。