networking - AI基础设施情报搜索

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2，宣称支持可用的1M token上下文窗口，并引入两种思考努力级别（Thinking-Effort Levels）。但未提供任何标准基准测试结果，引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程，实现端到端长文本推理。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

Amazon 其他 2026-06-10

Graviton5 与 Nitro 形式化验证：AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权

AWS 推出第五代自研 ARM 处理器 Graviton5，搭载于 M9g/M9gd 实例，性能提升 25%，支持 PCIe Gen6 和 DDR5-8800，首次引入形式化验证的 Nitro Isolation Engine。Meta 已部署数千万核支撑 agentic AI 推理，ARM 在云 CPU 赛道上完成关键突破。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Cloudflare 其他 2026-06-10

Cloudflare 将安全栈延伸至私有源站：DNS 路由开启应用层控制新范式

Cloudflare 发布 Application Services for Private Origins，允许企业客户通过 DNS 记录启用私有路由，将 WAF、Bot 管理、速率限制等安全服务应用于私有 IP 上的应用，无需公网暴露或 connector 软件。该功能基于 Cloudflare 已有的私有网络连接（IPsec/GRE/CNI/Mesh）实现，并支持 Spectrum 和 Workers VPC 绑定，构建统一的私有流量控制平面。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

Google Cloud推出GKE Inference Gateway，通过前缀缓存和模型感知路由，在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态，企业需警惕架构弹性损失。

Cisco 其他 2026-06-08

思科推出AI原生分支架构：AgenticOps与后量子加密重塑WAN控制平面

思科在Cisco Live 2026上完成Secure Router 8000系列更新，推出Unified Branch架构，集成AgenticOps自动化、后量子密码学（PQC）和混合网状防火墙，将控制平面从本地迁移至Cisco Cloud Control，为AI时代分支网络提供统一平台。

Cisco 其他 2026-06-08

思科Cloud Control与AI代理：控制层集中化下的隐性锁定与性能短板

思科在Cisco Live 2026推出Cloud Control统一管理平台，集成AI代理、Live Protect漏洞缓解、PQC及新硬件（C9550交换机、CW9177 AP等）。表面提升运维与安全，实则通过API和AI代理深度绑定用户，但其硬件在AI高带宽场景下存在端口密度和拥塞控制短板。

NVIDIA 其他 2026-06-08

NVIDIA联手斗山集团：以全栈物理AI平台重构工业自动化生态

NVIDIA与斗山集团扩大合作，将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS，并探索AI工厂电力（SMR、氢燃料电池）及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台，深度锁定工业自动化生态。

Cisco 其他 2026-06-04

Cisco Cloud Control统一平台：AgenticOps时代控制层向单一面板转移

Cisco Live 2026发布Cisco Cloud Control，统一网络、安全、计算、可观测性管理，支持AI代理协同操作。同时扩展Live Protect内核级安全补丁至N9000等，并公布量子安全路线图及新C9550/C8600硬件。

Cisco 其他 2026-06-03

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科宣布将Silicon One芯片用于校园网络，推出C9550/C9350系列智能交换机，配合Cloud Control平台，实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新，意图将控制平面从外围设备转移至芯片和云原生编排，以应对AI代理带来的持续流量和安全挑战。

Cisco 其他 2026-06-03

思科将OT安全控制点嵌入交换机ASIC：从可见性到执行的闭环锁定

思科在Cisco Live 2026发布Cyber Vision新功能，将安全策略自动推荐、模拟与执行直接集成到IE3500/IE9300工业交换机的自有ASIC中，并嵌入零信任远程访问。此举将OT安全从独立设备转移到网络基础设施内部，实现从可见性到预防的闭环，但旨在深度锁定用户于Cisco全栈。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One，实现从Pod到光纤的端到端可视化，并推出基于VXLAN ESG的AI作业分段，将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

NVIDIA 其他 2026-06-02

NVIDIA DGX Spark更新：一键部署本地AI代理，多节点集群扩展至400B模型

NVIDIA在Computex 2026发布DGX Spark软件更新，包括NemoClaw一键安装本地AI代理、Qwen3.6-35B模型在vLLM上实现2.6倍性能提升、以及Sync集群助手支持2-4节点通过ConnectX-7 200Gbps RoCE高速互联，使本地运行大规模自主代理和多节点分布式推理成为可能。

Cisco 其他 2026-06-02

思科AI Defense升级：以Agent供应链安全为名，行平台锁定之实

思科发布AI Defense重大更新，聚焦AI Agent安全，引入自适应红队测试、策略工作室（Policy Studio）和自动Agent依赖图扫描。新功能旨在实现跨平台（AWS Bedrock、Google ADK、LangChain）的上下文感知保护，但深度绑定Cisco Secure AI Factory与NVIDIA生态，隐藏了性能开销和迁移成本。

HPE 其他 2026-06-01

HPE推NVIDIA Vera CPU服务器，重构Agentic AI硬件生态

HPE发布ProLiant DL394 Gen12，搭载NVIDIA Vera CPU，专为Agentic AI与强化学习设计。强调极致单核性能与高内存带宽，集成iLO安全与Compute Ops Management，并联合Redpanda与NYSE探索金融场景应用。

NVIDIA 其他 2026-06-01

NVIDIA BlueField DPU硬件隔离安全：将AI工厂控制点从软件转向硅片

NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈（Argus、Vault、Flow），通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片，在不影响AI性能前提下提供分布式全栈保护，但深度绑定Vera Rubin平台，形成生态锁定。