情报
AI 生成的结构化厂商动态简报
NVIDIA与Intel达成50亿美元战略合作:AI芯片供应链新格局
NVIDIA与Intel于2025年9月18日宣布50亿美元战略合作:NVIDIA投资50亿美元获得Intel约4%股权,Intel为NVIDIA定制x86 CPU(用于AI基础设施)和集成RTX GPU芯粒的x86 SoC(用于PC产品)。双方通过NVLink实现架构互连,形成「AI计算+NVIDIA CUDA+x86生态」的联合体。此举重塑AI芯片供应链格局,对AMD和独立芯片设计厂商产生深远影响。
全球GPU短缺将持续至2027年:AI基础设施扩张的核心瓶颈
全球GPU短缺预计延续至2027-2028年,根源在于AI数据中心需求爆发、HBM产能受限、CoWoS封装紧张及地缘政治风险。NVIDIA Rubin平台量产受阻(目标从200万降至150万颗),2026年Blackwell将占据高端GPU出货71%。消费级RTX 5080/5070 Ti溢价200-500美元,企业AI基础设施采购周期将进一步延长。
思科发布AI网络流量报告,揭示智能体AI对广域网的根本性影响
思科基于真实网络流量数据发布研究报告,首次量化分析智能体AI对广域网流量模式、对称性及关键路径的颠覆性影响,并预测到2035年AI推理流量将占网络总流量的25%。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地
Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。
Intel Q1验证CPU/GPU 1:4配比趋势:Xeon 6如何改变AI推理基础设施的TCO计算
Intel Q1验证CPU:GPU配比从1:8回升至1:4,Xeon 6成为NVIDIA DGX-Rubin CPU,AMX指令集使CPU可在推理场景替代入门级GPU,单节点TCO降低40-60%
思科借硬件更新周期推动AI就绪数据中心架构
思科通过博客指出,企业AI战略受阻的核心在于数据中心基础设施。其主张将AI就绪性融入常规硬件更新周期,强调通过统一运营、网络内嵌安全、端到端可观测性及高性能网络来构建AI基础设施。
英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代
英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。
思科SD-WAN更新:AI应用分类、AI助手与Neocloud连接性集成
思科发布SD-WAN 26.1.1版本,重点增强AI就绪能力。更新包括对AI应用的自动识别与分类、内置生成式AI助手用于运维,以及与Megaport AI Exchange集成以连接分布式GPU和Neocloud环境。此举旨在优化AI流量性能与安全,并简化网络操作。
微软发布Azure Local大规模扩展,支持主权私有云部署数千节点
微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%
NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。