AI Research - AI基础设施情报搜索

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Cisco 其他 2026-05-12

思科用LLM宪法定义取代人工标注，锁定AI安全分类控制权

思科发布Single-Source Safety Definitions，用300+行宪法文档和LLM作为核心评估器，实现AI安全分类一致性。该方法将人工标注压缩为AI驱动，引入意图/内容双轴评估，减少LLM分歧达57倍，并作为Cisco AI Defense产品组合的默认安全分类法。

AMD 其他强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection（MRC）协议规范，旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制，提升网络带宽利用率和训练任务弹性。

Google 其他强信号 2026-05-04

谷歌发布企业级AI代理平台与第八代TPU，押注“代理时代”

谷歌在Cloud Next '26上推出Gemini企业级代理平台，用于构建和管理自主AI代理工作流，并发布专为代理AI设计的第八代TPU芯片。同时，谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。

Cisco 其他强信号 2026-04-30

思科发布AI模型溯源宪法，定义权重级衍生关系标准

思科发布《模型溯源宪法》，为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史，明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式，旨在解决当前行业在模型溯源定义上的不一致问题。

Cisco 其他强信号 2026-04-30

思科开源AI模型血缘工具包，瞄准AI供应链安全治理层

思科发布开源工具Model Provenance Kit，通过分析模型元数据、分词器及权重信号，生成唯一指纹并比对，以技术手段验证AI模型的血缘关系与完整性，旨在应对模型供应链中存在的篡改、伪造及合规风险。

Google 其他 2026-04-29

Google开放TPU硬件交付，第八代芯片性能跃升直指Nvidia腹地

Google在Q1财报中宣布第八代TPU（TPU 8t/8i），训练性能较前代提升3倍，推理性价比提升80%，并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购，强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。

Anthropic 其他强信号 2026-04-21

Anthropic与AWS签署千亿美元协议锁定未来十年AI算力

Anthropic与亚马逊AWS签署新协议，承诺未来十年投入超1000亿美元，锁定高达5吉瓦的AI算力容量，并计划将Claude平台深度集成至AWS。此举旨在应对其AI模型Claude的爆炸性需求增长，并巩固其作为AWS上关键AI模型提供商的地位。

NVIDIA 其他强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出，涉及硬件、软件、网络的全栈优化，以降低企业AI推理的总拥有成本。

Microsoft 其他强信号 2026-04-06

微软联合日本本土运营商构建主权AI基础设施

微软宣布未来四年在日投资100亿美元，核心是与日本樱花互联网和软银合作，通过Azure提供由本土运营商管理的GPU算力服务，确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。

NVIDIA 其他强信号 2026-04-05

NVIDIA推动物理AI在机器人领域的技术整合

NVIDIA在机器人周展示物理AI技术突破，通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型，实现太阳能机器人精准除草，降低90%除草剂依赖。

NVIDIA 其他强信号 2026-04-03

英伟达联合谷歌优化Gemma 4，强化本地AI代理基础设施

英伟达宣布与谷歌合作，针对其RTX、DGX Spark及Jetson平台，对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站，为本地AI代理（Agentic AI）提供从2B到31B参数的全栈模型支持。

NVIDIA 其他强信号 2026-03-31

NVIDIA联合能源厂商推动AI工厂成为智能电网资产

NVIDIA与能源软件公司Emerald AI合作，提出将大型AI数据中心（AI工厂）从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制，旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作，以支持AI负载并加速电力接入。

NVIDIA 其他强信号 2026-03-26

NVIDIA推出物理AI数据工厂蓝图，将计算转化为合成数据

NVIDIA在GTC上发布物理AI数据工厂蓝图，这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器，旨在解决真实世界数据难以规模化获取和处理的瓶颈，为下一代自主系统和机器人提供数据引擎。

NVIDIA 其他强信号 2026-03-26

英伟达组建Nemotron联盟，推动开放前沿模型协作

英伟达在GTC上宣布成立Nemotron联盟，联合Mistral AI等模型构建者和AI实验室，共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力，推动开放模型生态，并强调未来AI将由开放与专有模型共同构成的系统驱动。

NVIDIA 其他强信号 2026-03-25

英伟达联合能源机构展示AI算力工厂参与电网调峰

英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作，成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求，动态调节自身功耗以充当电网的“减震器”，同时保障高优先级AI工作负载的性能。

NVIDIA 其他强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配（DRA）驱动捐献给CNCF，使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区，并协同多家云厂商推动标准化。

NVIDIA 其他强信号 2026-03-23

英伟达推出OpenShell，为自主AI代理建立运行时安全沙盒

英伟达发布开源项目OpenShell，旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型，在系统层面隔离代理操作与策略执行，防止策略被覆盖或数据泄露。此举与多家安全厂商合作，推动企业级AI代理的统一策略层。

NVIDIA 其他强信号 2026-03-18

NVIDIA推动AI机器人从模拟到生产的技术突破

NVIDIA在物理AI领域展示机器人开发新范式，通过统一仿真与生产环境加速产业自动化进程。该方案整合AI训练框架与边缘计算架构，为制造业、农业等领域提供端到端机器人开发平台。