情报
AI 生成的结构化厂商动态简报
Cisco安全组合全面迁入AWS Marketplace:生态绑定加速,多云中立性存疑
Cisco宣布将其全套SaaS安全产品(Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等)通过AWS Marketplace提供,并与Amazon Bedrock、SageMaker深度集成,强化AI安全与零信任代理管理。此举旨在简化采购、加速部署,但显著加深对AWS生态的依赖,可能牺牲多云灵活性。
Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion
...
Cisco G300芯片:AI网络控制平面争夺的封闭锁链
Cisco发布Silicon One G300可编程AI网络芯片,针对AI数据中心和ML集群。该芯片是Cisco统一路由、交换和AI加速架构的延伸,但实质是通过专有控制平面和软件栈锁定用户,对抗Broadcom、Nvidia等开放生态。
AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO
AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型
NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。
NVIDIA携ASUS推桌面级DGX Station:GB300芯片下放,控制点从云转向本地硬件生态
ASUS发布ExpertCenter Pro ET900N G3,基于NVIDIA DGX Station GB300架构,搭载GB300 Grace Blackwell Ultra芯片,提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载,通过NVLink-C2C实现高速互连,并集成NVIDIA AI软件栈与NemoClaw框架。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。
Carmen Li推动GPU期货市场:算力金融化将颠覆AI基础设施采购模式
Carmen Li通过Silicon Data和Compute Exchange构建GPU价格指数和现货市场,目标推出计算期货。该计划获DRW支持,旨在解决GPU价格波动,标准化算力交易,可能创造万亿美元级新资产类别,彻底改变AI算力的定价与分配机制。
Cloudflare吸纳Ensemble团队:架构级模型压缩重塑边缘推理经济
Cloudflare宣布吸纳Ensemble AI核心团队,引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理,直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本,提升GPU利用率,并加速全球边缘AI部署。
NVIDIA借DSX平台与SK电讯共建千兆瓦级AI云,加速主权AI工厂生态锁定
SK电讯宣布采用NVIDIA DSX平台在韩国建设千兆瓦级AI云,首个AI工厂2027年上线。该平台整合NVIDIA加速计算、系统与软件,支持主权、物理及代理AI服务,旨在成为亚洲AI基础设施标杆。
NVIDIA与SK海力士深度捆绑:定制内存重塑AI工厂生态,锁定Vera Rubin与Jetson Thor
NVIDIA与SK hynix宣布多年期技术合作,将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造,构建自主晶圆厂数字孪生。
NVIDIA推出Vera CPU:从GPU加速迈向AI Agent控制平面自主化
NVIDIA发布专为AI Agent设计的Vera CPU,基于88核Olympus架构,配备1.2TB/s LPDDR5X内存,声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等,意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。
NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升,定义新推理标准
NVIDIA在第三方AA-AgentPerf基准测试中,凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化,实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量,直接冲击数据中心容量规划。
NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍
NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。
NVIDIA发布Halos OS:以安全认证操作系统夺取自动驾驶控制权
NVIDIA推出Halos全栈安全系统,包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications,以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台,旨在为L4级自动驾驶提供内建安全,而非事后补丁。
思科借Splunk整合构建Cisco Cloud Control:控制平面向AI原生统一平台迁移
思科在Cisco Live上宣布Cisco Cloud Control,将网络基础设施与Splunk数据分析深度绑定,推出Agentic SRE/SOC等AI运维产品。该平台旨在通过统一控制平面管理数据、基础设施和AI信任,降低MTTR和成本,但实质是强化对用户网络和可观测性栈的锁定。
NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU
NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。
AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建
AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。
NVIDIA将BESS嵌入AI工厂电力架构:电力控制层从电网转向智能储能系统
NVIDIA通过DSX平台将电池储能系统(BESS)作为AI工厂电力架构的系统级组件,而非独立附加。BESS结合逆变器、实时遥测和动态控制,实现负载平滑、扰动穿越、加速互联,并定义自认证指南,推动电力基础设施从被动备用转向主动控制。