Reports
AI-generated structured vendor updates
英特尔至强6成为NVIDIA DGX Rubin主机CPU,强化AI推理基础设施
英特尔至强6处理器被选为NVIDIA DGX Rubin NVL8 AI系统的主机CPU,提供3倍内存带宽提升和全路径机密计算能力。该合作凸显了CPU在AI推理负载中负责数据编排、调度和安全的架构价值。
三星发布HBM4E内存与混合铜键合技术,强化AI基础设施布局
三星在GTC 2026宣布HBM4量产并展示下一代HBM4E,带宽达4TB/s。采用混合铜键合技术实现16层以上堆叠,热阻降低20%。同时推出针对NVIDIA AI基础设施的SOCAMM2内存和PCIe 6.0 SSD产品线。
HPE联合英伟达在国家实验室部署主权AI工厂
HPE宣布将与英伟达合作,为美国阿贡国家实验室和德国斯图加特高性能计算中心部署液冷主权AI系统。此举旨在为政府和研究机构提供符合数据主权与合规要求的AI基础设施,加速其AI计划的部署与扩展。
思科通过认证翻新设备加速AI数据中心部署
思科推出认证翻新设备计划,通过提供经过严格测试、性能与新品一致且享有完整保修的硬件,帮助企业快速构建AI就绪数据中心。该方案可将部署时间压缩高达80%,同时优化资本效率和推进可持续发展。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。
Meta加速自研AI芯片路线图,专注推理优化
Meta计划两年内推出四代自研AI芯片MTIA系列,采用‘推理优先’设计策略,专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建,支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab建立多年战略合作,部署至少1 GW的下一代Vera Rubin系统,支持前沿AI模型训练和可规模化定制AI平台。双方将共同设计训练和推理系统,并拓宽企业及研究机构对前沿AI和开源模型的访问。
NVIDIA与Coherent合作开发数据中心光互连技术
NVIDIA与光子学供应商Coherent达成战略合作,共同开发下一代数据中心光互连技术。该合作聚焦高性能、高密度、低功耗光学解决方案,旨在解决AI与HPC工作负载的带宽与能效瓶颈。此举强化NVIDIA在AI基础设施硬件生态的系统级优化能力。
NVIDIA与Coherent合作开发数据中心光互连技术
NVIDIA与光学技术厂商Coherent达成战略合作,共同开发下一代数据中心光互连解决方案。双方将整合AI计算与光子技术,针对AI集群和高性能计算需求提供更高带宽、低延迟的光学互连。
Palo Alto Networks 提出服务提供商转型安全AI工厂战略
Palo Alto Networks 提出服务提供商应转型为'安全AI工厂',构建集成AI开发、部署、治理和安全防护的综合性平台。该平台强调内嵌式安全层,提供针对模型投毒、数据泄露的主动防护,将安全从防御成本重构为商业赋能核心。
三星与NVIDIA完成AI-RAN多小区测试验证芯片级集成
三星在真实网络环境中完成vRAN软件与NVIDIA加速计算平台的集成测试,验证了AI算法对无线网络物理层性能的直接优化。双方合作深入至芯片级架构,通过统一处理器优化CPU与GPU间高速连接,提升频谱效率和网络容量。
AMD与TCS合作在印度部署Helios AI机架架构
AMD与塔塔咨询合作,在印度市场推出基于Instinct MI300加速器的Helios机架级AI架构,支持大规模AI训练和推理工作负载。该解决方案以完整机架形式交付,可扩展至数千节点集群,专为生成式AI和HPC优化。合作结合TCS的云、AI和网络安全集成服务,提供端到端AI解决方案。
AWS发布Inferentia2推理芯片优化生成式AI基础设施
亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。
微软与Starlink合作推进AI-ready社区数字接入战略
微软宣布与Starlink合作,通过低地球轨道卫星连接为农村和偏远地区提供数字接入工具。公司将其数字接入战略从覆盖演进为采用与赋能,构建包含可靠能源、可负担设备和AI工具的系统性解决方案。这一举措旨在支持全球AI经济发展,构建AI-ready社区基础设施。
苹果在美扩建AI服务器制造与Mac生产线
苹果将Mac mini生产线首次转移至美国休斯顿,并扩大AI服务器制造业务,本地生产逻辑板等核心组件。同时投资建设先进制造中心,提供技术培训以提升美国制造业技能水平。
思科扩展AI安全架构并推出合作伙伴激励计划
思科发布针对AI代理安全的新解决方案,扩展AI Defense保护AI应用供应链和模型完整性,推出SASE for Agentic AI实现自动化检测和访问控制。同时通过Security Cloud Control引入AgenticOps自主修复能力,并推出Duo for Active Directory加强身份安全。
Meta与AMD达成6GW AI基础设施战略合作
Meta宣布与AMD达成多年期战略合作,将部署高达6GW的AMD Instinct GPU计算能力。双方将基于AMD GPU、EPYC CPU和共同开发的Helios机架架构进行多代深度整合,支持Meta的多元化计算战略。首批部署计划于2026年下半年开始。
英特尔与SambaNova合作拓展AI推理基础设施
英特尔宣布与SambaNova建立多年战略合作,共同开发基于至强处理器基础设施的AI推理解决方案。该合作整合英特尔计算、网络、存储硬件与SambaNova AI平台,面向异构数据中心提供机架级推理选项。英特尔强调此举不影响其自主GPU路线图,将继续投资边缘到云的AI产品体系。
思科联合NVIDIA推出澳大利亚首个主权AI工厂
思科与Sharon AI合作,在澳大利亚部署基于1024个NVIDIA Blackwell Ultra GPU的AI工厂,整合UCS服务器、Nexus Hyperfabric和VAST Data存储,提供境内数据处理的AI基础设施。
OpenAI启动印度计划布局AI基础设施与人才培养
OpenAI宣布'OpenAI for India'计划,重点建设本地化AI基础设施以降低延迟和提升合规性,同时通过企业赋能和技能提升项目扩大市场渗透。该计划强化了OpenAI在关键增长市场的本地化战略,但未披露具体技术架构细节或基础设施投资规模。