GitHub - AI基础设施情报搜索

Google Cloud 其他 2026-06-17

Google Cloud推OKF v0.1：用Markdown重新定义AI智能体知识控制平面

Google Cloud发布Open Knowledge Format (OKF) v0.1，一种供应商中立的Markdown规范，旨在为AI智能体提供结构化上下文知识。OKF将知识表示为带YAML前置元数据的markdown文件目录，无需专有服务或SDK，可托管于任何文件系统，直指企业知识碎片化与互操作性痛点。

Anthropic 其他 2026-06-17

Anthropic Agent SDK计费独立，AI编程进入生产级工程化

...

Anthropic 其他 2026-06-17

微软Work IQ API GA：以语义层锁死AI代理，控制企业数据入口

微软于2026年6月16日正式发布Work IQ APIs，为M365 AI代理提供统一的语义层，将传统API表面压缩为10个通用MCP工具，声称性能提升2倍且令牌消耗减少80%，采用Copilot Credits消费计费。此举实质是控制企业AI代理的数据访问入口。

Microsoft 其他 2026-06-16

微软Agent 365控制平面：以管理锁替代模型锁，构筑AI时代的Entra帝国

微软发布Agent 365作为AI代理的统一控制平面，整合Entra、Defender、Purview、Intune及成本管理，同时推出Microsoft IQ语义平台。宣称模型多样化与开放，实则通过管理工具链锁定企业AI资产，将控制权从模型层转移到微软基础设施层。

NVIDIA 其他 2026-06-16

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

SiMa.ai发布开源Palette Neat开发环境，结合低功耗Modalix SoM（<10W），通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM，无需重新设计载板，旨在打破GPU生态锁定。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2，宣称支持可用的1M token上下文窗口，并引入两种思考努力级别（Thinking-Effort Levels）。但未提供任何标准基准测试结果，引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程，实现端到端长文本推理。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA发布NVFP4格式，利用Blackwell原生硬件支持，在JAX/MaxText中实现4位混合精度预训练。相比FP8基线，Llama 3.1 405B在GB300上获得1.73倍吞吐提升，且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新，显著降低训练成本，但深度绑定NVIDIA硬件生态。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**，一个550B参数MoE模型（55B活跃），专为AI Agent编排而设计。通过**多教师在线策略蒸馏（MOPD）** 与**Hybrid Mamba-Transformer**架构，其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省，标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-03

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

思科发布Secure Access Agent Gateway，将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份，在LLM、MCP工具、SaaS API等交互点实施策略，实现行动级审计和凭证注入，旨在解决代理自主行动带来的新安全风险。

Microsoft Azure 产品发布 2026-06-03

微软Maia 200量产+Cobalt 200预览：自研双芯合围NVIDIA，AI推理控制权转移

微软在Build 2026宣布Maia 200 AI推理芯片量产，Cobalt 200 ARM处理器预览，并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈，意图在推理环节降低对NVIDIA GPU的依赖，并锁定Azure AI工作负载。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

Google 其他 2026-06-02

Google 开源 gcs-analytics-core 库，以并行 I/O 和预取优化 Iceberg/Spark 性能

Google Cloud 推出 gcs-analytics-core 开源 Java 库，集成于 Iceberg 1.11.0+ 的 GCSFileIO，通过 Vectored I/O 和 Smart Parquet prefetching 减少扫描延迟。TPC-DS 测试显示扫描时间提升 18%-71%，但执行时间提升有限（大数据集仅 1.58%）。

Meta 其他强信号 2026-06-02

Build 2026：Project Polaris自研模型替代GPT-4 Turbo，GitHub Copilot开启去OpenAI化

微软在Build 2026开发者大会发布Project Polaris自研编码模型，计划2026年8月起替代OpenAI GPT-4 Turbo成为GitHub Copilot默认推理引擎，3个月过渡期可选保留旧模型。这标志着微软首次从模型层正式脱离对OpenAI的依赖。同时Anthropic Claude已集成进Copilot，支持多模型draft+review协同工作流。微软首次公开将Claude列为主要追赶目标，战略信号：模型层自立，分发和运行时才是持久护城河。

NVIDIA 其他 2026-06-01

NVIDIA Alpamayo闭环RL后训练：加速自动驾驶策略的模拟-现实融合

NVIDIA Alpamayo平台推出AlpaGym，一个开源、高吞吐量的闭环强化学习后训练框架。该框架将AlpaSim模拟器、Cosmos-RL分布式训练和物理AI数据集整合，使AV模型能从自身动作的模拟后果中学习，大幅缩小训练与部署的误差累积鸿沟。

NVIDIA 其他 2026-06-01

NVIDIA Cosmos 3开源统一物理AI模型，以MoT架构合围GPU生态

NVIDIA发布Cosmos 3，基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集，但部署优化深度绑定NVIDIA NIM微服务与GPU，意图将物理AI开发生态锁定在其硬件和软件栈上。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS：以开源软件夺取AI工厂控制平面，锁定生态

NVIDIA发布DSX OS，一套开源模块化软件，用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件，统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU，但核心依赖NVIDIA专有硬件，旨在锁定用户至其生态。

Google 其他 2026-05-29

Google发布A2UI开放协议：以JSON描述UI，重塑AI代理交互生态

Google推出A2UI开放协议，允许AI代理通过JSON payload描述交互式UI（如日期选择器、地图），并在Gemini Enterprise中原生渲染。该协议与A2A、Flutter等集成，旨在解决代理仅返回文本的局限性，同时避免HTML注入风险。

Other 其他 2026-05-22

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险

BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致，通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库，使SSE/HTTP传输模式的AI Agent服务器直接暴露，可导致数据泄露乃至RCE。

情报

筛选

Google Cloud推OKF v0.1：用Markdown重新定义AI智能体知识控制平面

Anthropic Agent SDK计费独立，AI编程进入生产级工程化

微软Work IQ API GA：以语义层锁死AI代理，控制企业数据入口

微软Agent 365控制平面：以管理锁替代模型锁，构筑AI时代的Entra帝国

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

微软Maia 200量产+Cobalt 200预览：自研双芯合围NVIDIA，AI推理控制权转移

微软Build大会：从芯片到云构建Agent时代统一生态

Google 开源 gcs-analytics-core 库，以并行 I/O 和预取优化 Iceberg/Spark 性能

Build 2026：Project Polaris自研模型替代GPT-4 Turbo，GitHub Copilot开启去OpenAI化

NVIDIA Alpamayo闭环RL后训练：加速自动驾驶策略的模拟-现实融合

NVIDIA Cosmos 3开源统一物理AI模型，以MoT架构合围GPU生态

NVIDIA DSX OS：以开源软件夺取AI工厂控制平面，锁定生态

Google发布A2UI开放协议：以JSON描述UI，重塑AI代理交互生态

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险