inference - AI基础设施情报搜索

Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台，争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台，基于 bedrock-mantle 端点，原生支持 OpenAI 和 Anthropic API 协议，允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化，旨在通过统一推理平面锁定用户工作流，削弱单一模型提供商的 API 壁垒。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One，实现从Pod到光纤的端到端可视化，并推出基于VXLAN ESG的AI作业分段，将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

Intel 其他 2026-06-02

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+（288 e-cores），与 Perplexity 合作推出混合本地推理编排，与 Foxconn 共建机架级 AI 基础设施，与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色，意图将控制平面从 GPU 转移至 x86。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施，并展示由Vector Core Compute运营的完全解耦推理云（预填充用NVIDIA Blackwell，解码用RDU）。此举旨在将CPU重新置于AI推理核心，改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例，联合 Revolut、Mastercard 等金融机构，推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架，将金融数据处理从特征工程转向统一嵌入，实质是控制层向 NVIDIA 硬件生态转移。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark：统一内存架构重塑Agentic PC生态，合围x86阵营

Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台，采用统一内存架构，专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力，显著降低token处理成本，标志着PC从应用驱动向Agent驱动的根本转变，并得到微软的全面支持。

Amazon 其他 2026-06-02

AWS托管OpenAI GPT-5.5/Codex：控制层从模型转向云平台

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理，通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施，实现数据驻留与容量管理，但用户被锁定在Bedrock生态中。

NVIDIA 其他 2026-06-01

NVIDIA FOX蓝图：工厂控制层从PLC转向AI代理，锁定DGX硬件

NVIDIA发布Factory Operations Blueprint (FOX)，基于NemoClaw和DGX Station (GB300 Grace Blackwell Ultra Desktop Superchip)构建自主工厂管理代理，整合机器信号、质量系统与机器人车队，实现全厂智能决策。富士康、和硕、研华、纬创已部署，预计根因分析效率提升80%，劳动生产力提升15%。

NVIDIA 其他 2026-06-01

NVIDIA BlueField DPU硬件隔离安全：将AI工厂控制点从软件转向硅片

NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈（Argus、Vault、Flow），通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片，在不影响AI性能前提下提供分布式全栈保护，但深度绑定Vera Rubin平台，形成生态锁定。

NVIDIA 其他 2026-06-01

NVIDIA Vera CPU：自研Olympus核心与LPDDR5X，专为Agentic AI工厂重塑CPU设计点

NVIDIA发布Vera CPU，集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络，针对Agentic AI和强化学习中的CPU执行瓶颈，宣称比x86架构性能提升1.8倍，并将内存功耗降至30W以下，推动AI工厂从“每核心成本”向“每Token成本”转变。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS：以开源软件夺取AI工厂控制平面，锁定生态

NVIDIA发布DSX OS，一套开源模块化软件，用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件，统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU，但核心依赖NVIDIA专有硬件，旨在锁定用户至其生态。

Intel 其他 2026-06-01

Intel以Xeon 6+与E835重塑AI控制平面：CPU重新成为agentic AI的编排核心

Intel发布基于Intel 18A的Xeon 6+处理器（288个E-core）、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心，作为agentic AI工作负载的编排与数据移动控制平面，并试图通过E835以太网组合锁定AI数据中心网络标准。

Other 其他 2026-05-22

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险

BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致，通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库，使SSE/HTTP传输模式的AI Agent服务器直接暴露，可导致数据泄露乃至RCE。

Google 其他 2026-05-21

Google I/O 2026：Antigravity控制平面重塑AI开发范式，锁定代理编排生态

Google I/O 2026发布Antigravity 2.0桌面应用及CLI/SDK，作为统一代理控制平面，结合Gemini 3.5 Flash/Omni模型、Managed Agents API和AI Studio原生Android支持，旨在将AI开发从原型到生产无缝衔接，但实质是强化对开发者工作流和云资源的绑定。

Cisco 其他 2026-05-20

思科G300智能包流：AI网络性能的硬件加速新范式

思科发布基于Silicon One G300的Intelligent Packet Flow，通过硬件加速自适应路由、集体拥塞感知和遥测，将网络从传输层变为智能系统。在8K-16K GPU集群中，相比传统ECMP，CCT减少87%，JCT提升82%，GPU利用率提升28%。

Intel 其他 2026-05-20

Intel Core Ultra Series 3 以集成SoC替代离散GPU，重塑边缘机器人推理性价比

Intel Core Ultra Series 3 处理器集成CPU、GPU、NPU，成为Sensory AI等多家机器人公司的边缘推理主力，完全替代昂贵、高功耗的离散GPU。通过异构计算，机器人可在本地运行视觉、语言、运动等多智能体，无需云端，显著降低总拥有成本与部署门槛。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包，包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform，提供从低代码到代码优先的四层开发阶梯，旨在通过共享协议层统一本地开发与云端部署，但实质是将agent生命周期控制权集中于谷歌云管理平面。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

情报

筛选

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台，争夺 AI 推理控制权

微软Build大会：从芯片到云构建Agent时代统一生态

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

英特尔 Computex 2026：以 18A 和机架级系统重塑 AI 推理控制权

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

Arm与NVIDIA联手推出RTX Spark：统一内存架构重塑Agentic PC生态，合围x86阵营

AWS托管OpenAI GPT-5.5/Codex：控制层从模型转向云平台

NVIDIA FOX蓝图：工厂控制层从PLC转向AI代理，锁定DGX硬件

NVIDIA BlueField DPU硬件隔离安全：将AI工厂控制点从软件转向硅片

NVIDIA Vera CPU：自研Olympus核心与LPDDR5X，专为Agentic AI工厂重塑CPU设计点

NVIDIA DSX OS：以开源软件夺取AI工厂控制平面，锁定生态

Intel以Xeon 6+与E835重塑AI控制平面：CPU重新成为agentic AI的编排核心

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险

Google I/O 2026：Antigravity控制平面重塑AI开发范式，锁定代理编排生态

思科G300智能包流：AI网络性能的硬件加速新范式

Intel Core Ultra Series 3 以集成SoC替代离散GPU，重塑边缘机器人推理性价比

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命