情报
AI 生成的结构化厂商动态简报
AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存
AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。
思科用LLM宪法定义取代人工标注,锁定AI安全分类控制权
思科发布Single-Source Safety Definitions,用300+行宪法文档和LLM作为核心评估器,实现AI安全分类一致性。该方法将人工标注压缩为AI驱动,引入意图/内容双轴评估,减少LLM分歧达57倍,并作为Cisco AI Defense产品组合的默认安全分类法。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”
谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。
思科发布AI模型溯源宪法,定义权重级衍生关系标准
思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地
Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。
Anthropic与AWS签署千亿美元协议锁定未来十年AI算力
Anthropic与亚马逊AWS签署新协议,承诺未来十年投入超1000亿美元,锁定高达5吉瓦的AI算力容量,并计划将Claude平台深度集成至AWS。此举旨在应对其AI模型Claude的爆炸性需求增长,并巩固其作为AWS上关键AI模型提供商的地位。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA联合能源厂商推动AI工厂成为智能电网资产
NVIDIA与能源软件公司Emerald AI合作,提出将大型AI数据中心(AI工厂)从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制,旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作,以支持AI负载并加速电力接入。
NVIDIA推出物理AI数据工厂蓝图,将计算转化为合成数据
NVIDIA在GTC上发布物理AI数据工厂蓝图,这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器,旨在解决真实世界数据难以规模化获取和处理的瓶颈,为下一代自主系统和机器人提供数据引擎。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
NVIDIA推动AI机器人从模拟到生产的技术突破
NVIDIA在物理AI领域展示机器人开发新范式,通过统一仿真与生产环境加速产业自动化进程。该方案整合AI训练框架与边缘计算架构,为制造业、农业等领域提供端到端机器人开发平台。
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。