情报
AI 生成的结构化厂商动态简报
AMD与Upstage合作推出基于MI325X的主权AI基础设施方案
AMD与韩国AI公司Upstage深化合作,基于Instinct MI325X加速器构建主权AI基础设施解决方案。通过优化ROCm软件栈实现Solar LLM与硬件平台深度集成,提升AI训练和推理效率。该方案针对韩国市场数据主权要求提供本地化AI算力。
Parrot Analytics 部署 Amazon Bedrock AgentCore 实现高吞吐代理编排
Parrot Analytics 集成 Amazon Bedrock AgentCore 和 Amazon Nova 模型,实现 25 TPS 持续代理调用吞吐,构建媒体行业智能操作系统。通过专有数据与 AWS AI 基础设施结合,支持批量 AI 工作负载编排。该架构旨在推动媒体行业从回顾性测量转向预测性资本分配。
思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化
思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU,支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化,可实时分配PCIe GPU资源。该方案提供验证设计蓝图,加速AI推理、视觉AI等多工作负载的规模化部署。
NVIDIA发布开放物理AI数据工厂蓝图
NVIDIA推出开放物理AI数据工厂蓝图,提供标准化数据生成与合成框架,加速机器人、视觉AI和自动驾驶等物理AI应用的训练和开发。该蓝图通过参考架构解决大规模真实数据获取难题,降低行业门槛并推动研发迭代。
思科与英伟达扩展Secure AI Factory架构,融合网络与安全
思科与英伟达深化合作,扩展Secure AI Factory架构,支持从核心到边缘的AI部署。推出基于NVIDIA Spectrum的高性能交换机,并将安全策略执行扩展至DPU级别,集成AI护栏技术。
英伟达发布AI工厂参考设计与数字孪生蓝图
英伟达发布Vera Rubin DSX AI工厂参考设计与Omniverse DSX数字孪生蓝图,基于Spectrum-X以太网、Quantum-X800 InfiniBand和BlueField-3 DPU构建。该架构连接现实传感器与数字孪生,实现AI模型持续训练优化。此举将AI计算从数据中心扩展至物理世界自动化领域。
英特尔至强6成为NVIDIA DGX Rubin主机CPU,强化AI推理基础设施
英特尔至强6处理器被选为NVIDIA DGX Rubin NVL8 AI系统的主机CPU,提供3倍内存带宽提升和全路径机密计算能力。该合作凸显了CPU在AI推理负载中负责数据编排、调度和安全的架构价值。
三星发布HBM4E内存与混合铜键合技术,强化AI基础设施布局
三星在GTC 2026宣布HBM4量产并展示下一代HBM4E,带宽达4TB/s。采用混合铜键合技术实现16层以上堆叠,热阻降低20%。同时推出针对NVIDIA AI基础设施的SOCAMM2内存和PCIe 6.0 SSD产品线。
HPE联合英伟达在国家实验室部署主权AI工厂
HPE宣布将与英伟达合作,为美国阿贡国家实验室和德国斯图加特高性能计算中心部署液冷主权AI系统。此举旨在为政府和研究机构提供符合数据主权与合规要求的AI基础设施,加速其AI计划的部署与扩展。
思科通过认证翻新设备加速AI数据中心部署
思科推出认证翻新设备计划,通过提供经过严格测试、性能与新品一致且享有完整保修的硬件,帮助企业快速构建AI就绪数据中心。该方案可将部署时间压缩高达80%,同时优化资本效率和推进可持续发展。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。
Meta加速自研AI芯片路线图,专注推理优化
Meta计划两年内推出四代自研AI芯片MTIA系列,采用‘推理优先’设计策略,专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建,支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab建立多年战略合作,部署至少1 GW的下一代Vera Rubin系统,支持前沿AI模型训练和可规模化定制AI平台。双方将共同设计训练和推理系统,并拓宽企业及研究机构对前沿AI和开源模型的访问。
NVIDIA与Coherent合作开发数据中心光互连技术
NVIDIA与光子学供应商Coherent达成战略合作,共同开发下一代数据中心光互连技术。该合作聚焦高性能、高密度、低功耗光学解决方案,旨在解决AI与HPC工作负载的带宽与能效瓶颈。此举强化NVIDIA在AI基础设施硬件生态的系统级优化能力。
NVIDIA与Coherent合作开发数据中心光互连技术
NVIDIA与光学技术厂商Coherent达成战略合作,共同开发下一代数据中心光互连解决方案。双方将整合AI计算与光子技术,针对AI集群和高性能计算需求提供更高带宽、低延迟的光学互连。
Palo Alto Networks 提出服务提供商转型安全AI工厂战略
Palo Alto Networks 提出服务提供商应转型为'安全AI工厂',构建集成AI开发、部署、治理和安全防护的综合性平台。该平台强调内嵌式安全层,提供针对模型投毒、数据泄露的主动防护,将安全从防御成本重构为商业赋能核心。
三星与NVIDIA完成AI-RAN多小区测试验证芯片级集成
三星在真实网络环境中完成vRAN软件与NVIDIA加速计算平台的集成测试,验证了AI算法对无线网络物理层性能的直接优化。双方合作深入至芯片级架构,通过统一处理器优化CPU与GPU间高速连接,提升频谱效率和网络容量。
AMD与TCS合作在印度部署Helios AI机架架构
AMD与塔塔咨询合作,在印度市场推出基于Instinct MI300加速器的Helios机架级AI架构,支持大规模AI训练和推理工作负载。该解决方案以完整机架形式交付,可扩展至数千节点集群,专为生成式AI和HPC优化。合作结合TCS的云、AI和网络安全集成服务,提供端到端AI解决方案。
AWS发布Inferentia2推理芯片优化生成式AI基础设施
亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。
微软与Starlink合作推进AI-ready社区数字接入战略
微软宣布与Starlink合作,通过低地球轨道卫星连接为农村和偏远地区提供数字接入工具。公司将其数字接入战略从覆盖演进为采用与赋能,构建包含可靠能源、可负担设备和AI工具的系统性解决方案。这一举措旨在支持全球AI经济发展,构建AI-ready社区基础设施。