情报
AI 生成的结构化厂商动态简报
英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层
英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。
Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地
Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。
英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代
英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。
微软发布Foundry平台,定义持久化、有状态AI智能体新范式
微软CEO萨提亚·纳德拉展示了基于Foundry平台构建的持久化、有状态AI智能体。该平台支持智能体跨越时间边界运行,编排工具与模型,并在长周期工作流中实现评估与改进的闭环,标志着AI从对话式助手向自主执行系统的关键演进。
微软发布Azure Local大规模扩展,支持主权私有云部署数千节点
微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。
微软提出AI Agent成为企业软件主要用户,驱动三层架构重构
微软首席营销官提出,AI Agent正成为企业软件的主要“用户”,这要求软件从用户体验、业务逻辑到数据准备进行三层重构。核心变化在于,软件设计需同时服务人类和Agent,并将业务逻辑封装为Agent可调用的技能。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
思科通过资本部门加速AI数据中心融资模式转型
思科博客阐述其内部金融服务机构Cisco Capital如何提供灵活的支付解决方案,帮助客户应对AI数据中心快速迭代带来的资金压力。该模式旨在将硬件、软件和服务捆绑,简化采购流程,使IT支出与基础设施的演进周期保持一致。
微软通过Excel Copilot Agent Mode将AI推理层引入核心生产力界面
微软CEO宣布Copilot的Agent Mode在Excel中广泛推出,标志着AI从问答工具转向具备规划与执行能力的智能体。此举将AI推理和工作流自动化直接嵌入企业最广泛使用的数据工具界面,改变了人机协作模式。
微软将Office Copilot代理模式设为默认,推动AI原生工作流
微软宣布Copilot在Word、Excel和PowerPoint中的“代理模式”正式上市并设为默认。该模式允许AI直接在文档画布上进行推理和多步骤操作,标志着从辅助工具到嵌入式AI协作者的转变。
微软发布托管AI Agent基础设施,将AI Agent视为独立计算实体
微软通过Foundry平台推出“托管代理(Hosted agents)”,为每个AI Agent提供独立、隔离的企业级沙盒环境,包含持久化状态、内置身份与治理。此举旨在将AI Agent的运行时基础设施标准化,降低企业部署门槛,但评论指出此举将控制点从应用层转移至基础设施层。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
微软推出“前沿成功”框架,将智能体AI与企业工作流深度融合
微软在香港AI巡展上推出“前沿成功”框架,旨在帮助企业将智能体AI从实验阶段转向规模化运营。该框架通过整合Copilot、Work IQ和Agent 365等组件,强调在深度工作上下文和安全治理基础上实现AI价值。
Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态
Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。
思科发布OT安全入门框架,强调经济性与可执行性
思科发布工业OT安全入门框架,针对中型企业资源有限现状,提出分阶段、低成本的实施路径。核心是避免因过度依赖SPAN端口等被动监控架构而产生高昂的隐性基础设施成本,转而利用现有网络设备(如支持Cyber Vision的交换机)实现初步可见性。
思科通过融合网络与数字框架,展示医疗行业智能建筑蓝图
思科与合作伙伴Computacenter、EllisDon合作,为西林肯纪念医院重建项目提供融合网络基础设施,并与EllisDon的EKO数字框架深度集成。该项目旨在构建一个将临床系统、设备与工作流统一连接的数字基础,通过实时通信和自动化提升应急响应与日常运营效率。
思科发布AI-RRM,将AI深度嵌入无线网络控制平面
思科发布AI驱动的无线资源管理(AI-RRM)功能,通过引入时间感知和趋势学习,在非高峰时段主动优化网络,改变了传统RRM的被动响应模式。该服务作为单一架构同时支持云和本地部署,并强调透明度和人机协同,是思科AgenticOps战略的关键组件。
思科与罗克韦尔深化合作,推动工业AI从试点走向规模化生产
思科与罗克韦尔自动化强化战略合作,旨在解决工业AI从试点到规模化部署的瓶颈。双方强调,阻碍规模化部署的核心并非AI模型或算力,而是底层网络、计算、可观测性与安全集成的统一基础设施。该合作聚焦于通过思科统一边缘等平台,将AI能力嵌入生产现场,实现实时质量检测与预测性维护。