Reports
AI-generated structured vendor updates
思科发布AI模型溯源宪法,定义权重级衍生关系标准
思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
Cloudflare与Stripe合作推出AI代理自动部署协议
Cloudflare与Stripe合作推出新协议,使AI代理能自动为用户创建Cloudflare账户、购买域名并部署应用。该协议标准化了服务发现、授权和支付流程,旨在将AI代理作为云服务的一等公民,并计划向更多平台开放。
Palo Alto收购Portkey:抢占AI代理安全控制平面
Portkey收购是Palo Alto"平台整合"战略的最新落子。不同于CrowdStrike的"精品优先"模式,Palo Alto正通过持续并购补全AI安全能力矩阵。收购完成后,Palo Alto将拥有覆盖网络、云、端点、安全运营、AI安全的完整平台。
谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长
谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
Google发布Gemini企业级代理平台,定义AI代理时代技术栈
Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。
NVIDIA联手Adobe与WPP,以OpenShell为核心构建企业级AI代理安全架构
NVIDIA深化与Adobe、WPP的战略合作,旨在将智能AI代理置于企业营销运营的核心。其关键动作是推出并强调NVIDIA OpenShell安全运行时,为运行多步工作流的AI代理提供基于策略的、可审计的隔离执行环境。这标志着从单纯的功能性AI向受控、可信的企业级AI代理架构演进。
Anthropic发布Claude Opus 4.7并引入网络安全护栏
Anthropic正式发布Claude Opus 4.7模型,在复杂软件工程、多模态理解和长时推理任务上实现显著提升。该版本首次引入了针对高风险网络安全用途的自动检测与拦截护栏,并为安全研究设立了验证程序,旨在为更强大模型(如Mythos)的广泛发布积累安全经验。
Claude Opus 4.7发布:SWE-bench 87.6%刷新SOTA
Anthropic发布Claude Opus 4.7,刷新SWE-bench 87.6% SOTA。编程能力暴涨11%,Cursor代码完成率从58%升至70%。视觉理解3倍提升,支持375万像素图像。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
微软发布高效AI图像模型,成本降低41%并瞄准规模化生产
微软发布MAI-Image-2-Efficient模型,在保持旗舰级质量的同时,推理速度提升22%,效率提升4倍,成本降低41%。该模型定位为规模化生产“主力”,已集成至Microsoft Foundry和Copilot,旨在降低企业AI应用门槛。
思科以自身实践验证AI本地化部署的安全与成本逻辑
思科客户体验(CX)部门通过部署基于UCS服务器和Nexus交换机的本地AI基础设施,处理敏感客户数据,以应对云上数据主权和推理成本不可预测的挑战。此举展示了将AI工作负载从可变运营成本转向确定性资本投资的架构选择。
思科与英特尔合作推出统一边缘平台
思科推出基于英特尔Xeon 6 SoC的Unified Edge平台,针对体育与媒体行业提供边缘AI处理能力。该方案整合网络、安全与计算功能,支持实时粉丝体验与远程制作。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。