情报
AI 生成的结构化厂商动态简报
Google Cloud推OKF v0.1:用Markdown重新定义AI智能体知识控制平面
Google Cloud发布Open Knowledge Format (OKF) v0.1,一种供应商中立的Markdown规范,旨在为AI智能体提供结构化上下文知识。OKF将知识表示为带YAML前置元数据的markdown文件目录,无需专有服务或SDK,可托管于任何文件系统,直指企业知识碎片化与互操作性痛点。
Anthropic Agent SDK计费独立,AI编程进入生产级工程化
...
微软Work IQ API GA:以语义层锁死AI代理,控制企业数据入口
微软于2026年6月16日正式发布Work IQ APIs,为M365 AI代理提供统一的语义层,将传统API表面压缩为10个通用MCP工具,声称性能提升2倍且令牌消耗减少80%,采用Copilot Credits消费计费。此举实质是控制企业AI代理的数据访问入口。
微软Agent 365控制平面:以管理锁替代模型锁,构筑AI时代的Entra帝国
微软发布Agent 365作为AI代理的统一控制平面,整合Entra、Defender、Purview、Intune及成本管理,同时推出Microsoft IQ语义平台。宣称模型多样化与开放,实则通过管理工具链锁定企业AI资产,将控制权从模型层转移到微软基础设施层。
SiMa.ai推Palette Neat:用自然语言代理环境拆解英伟达GPU护城河
SiMa.ai发布开源Palette Neat开发环境,结合低功耗Modalix SoM(<10W),通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM,无需重新设计载板,旨在打破GPU生态锁定。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型
NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。
NVIDIA NVFP4:原生4位训练实现1.73倍吞吐跃升,锁定Blackwell生态
NVIDIA发布NVFP4格式,利用Blackwell原生硬件支持,在JAX/MaxText中实现4位混合精度预训练。相比FP8基线,Llama 3.1 405B在GB300上获得1.73倍吞吐提升,且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新,显著降低训练成本,但深度绑定NVIDIA硬件生态。
NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本
NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。
思科Agent Gateway:零信任从访问控制升级为AI代理行动控制
思科发布Secure Access Agent Gateway,将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份,在LLM、MCP工具、SaaS API等交互点实施策略,实现行动级审计和凭证注入,旨在解决代理自主行动带来的新安全风险。
微软Maia 200量产+Cobalt 200预览:自研双芯合围NVIDIA,AI推理控制权转移
微软在Build 2026宣布Maia 200 AI推理芯片量产,Cobalt 200 ARM处理器预览,并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈,意图在推理环节降低对NVIDIA GPU的依赖,并锁定Azure AI工作负载。
微软Build大会:从芯片到云构建Agent时代统一生态
微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。
Google 开源 gcs-analytics-core 库,以并行 I/O 和预取优化 Iceberg/Spark 性能
Google Cloud 推出 gcs-analytics-core 开源 Java 库,集成于 Iceberg 1.11.0+ 的 GCSFileIO,通过 Vectored I/O 和 Smart Parquet prefetching 减少扫描延迟。TPC-DS 测试显示扫描时间提升 18%-71%,但执行时间提升有限(大数据集仅 1.58%)。
Build 2026:Project Polaris自研模型替代GPT-4 Turbo,GitHub Copilot开启去OpenAI化
微软在Build 2026开发者大会发布Project Polaris自研编码模型,计划2026年8月起替代OpenAI GPT-4 Turbo成为GitHub Copilot默认推理引擎,3个月过渡期可选保留旧模型。这标志着微软首次从模型层正式脱离对OpenAI的依赖。同时Anthropic Claude已集成进Copilot,支持多模型draft+review协同工作流。微软首次公开将Claude列为主要追赶目标,战略信号:模型层自立,分发和运行时才是持久护城河。
NVIDIA Alpamayo闭环RL后训练:加速自动驾驶策略的模拟-现实融合
NVIDIA Alpamayo平台推出AlpaGym,一个开源、高吞吐量的闭环强化学习后训练框架。该框架将AlpaSim模拟器、Cosmos-RL分布式训练和物理AI数据集整合,使AV模型能从自身动作的模拟后果中学习,大幅缩小训练与部署的误差累积鸿沟。
NVIDIA Cosmos 3开源统一物理AI模型,以MoT架构合围GPU生态
NVIDIA发布Cosmos 3,基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集,但部署优化深度绑定NVIDIA NIM微服务与GPU,意图将物理AI开发生态锁定在其硬件和软件栈上。
NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态
NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。
Google发布A2UI开放协议:以JSON描述UI,重塑AI代理交互生态
Google推出A2UI开放协议,允许AI代理通过JSON payload描述交互式UI(如日期选择器、地图),并在Gemini Enterprise中原生渲染。该协议与A2A、Flutter等集成,旨在解决代理仅返回文本的局限性,同时避免HTML注入风险。
BadHost漏洞暴露Starlette认证绕过,全球AI Agent基础设施面临HTTP走私风险
BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致,通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库,使SSE/HTTP传输模式的AI Agent服务器直接暴露,可导致数据泄露乃至RCE。