筛选

×
当前筛选 清除全部
关键词: Scaling ×
88 情报总数
1/5 当前页
Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。

Amazon 其他 2026-06-02

AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。

Google 其他 2026-06-01

AlloyDB Remote MCP Server GA:Google Cloud以开放协议重塑AI代理数据访问生态

Google Cloud宣布AlloyDB Remote MCP Server正式GA,允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议,提供IAM细粒度授权、Model Armor防护和审计日志,并集成AlloyDB的ScaNN向量索引(10亿+向量,6倍速度)与AI函数,旨在成为企业AI代理的单一数据源。

NVIDIA 其他 2026-06-01

NVIDIA Vera CPU:自研Olympus核心与LPDDR5X,专为Agentic AI工厂重塑CPU设计点

NVIDIA发布Vera CPU,集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络,针对Agentic AI和强化学习中的CPU执行瓶颈,宣称比x86架构性能提升1.8倍,并将内存功耗降至30W以下,推动AI工厂从“每核心成本”向“每Token成本”转变。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态

NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。

Intel 其他 2026-06-01

Intel以Xeon 6+与E835重塑AI控制平面:CPU重新成为agentic AI的编排核心

Intel发布基于Intel 18A的Xeon 6+处理器(288个E-core)、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心,作为agentic AI工作负载的编排与数据移动控制平面,并试图通过E835以太网组合锁定AI数据中心网络标准。

Nokia 其他 2026-05-29

诺基亚1830 GX多轨OLS:以密度和功耗优势重塑AI集群跨站点光互联经济性

诺基亚发布1830 GX多轨开放线路系统(OLS),在1RU内支持4个光纤轨,实现40RU机架部署160轨,功耗每轨降低超60%。该方案专为AI集群跨数据中心互联(Scale-Across)设计,通过集成C+L波段EDFA、DGE、OCM和OTDR,解决传统ILA站点空间与功耗瓶颈,实现9.6THz频谱容量。

Cisco 其他 2026-05-28

Cisco Scale-Across架构:硅光融合定义AI跨数据中心网络新标准

Cisco发布Scale-Across方案,基于Silicon One P200路由系统(51.2Tbps)和400G/800G ZR/ZR+相干光模块,结合开放线路系统,旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题,实现类似单机房的低延迟无损连接。

Huawei 其他 2026-05-25

华为韬定律:逻辑折叠绕开光刻限制,固定制程密度跃升55%

华为何庭波在ISCAS 2026提出韬定律,以特征时间常数tau为统一优化目标,替代传统几何缩放。核心技术逻辑折叠通过垂直堆叠有源层缩短关键路径,在固定制程(如N+2)下实现晶体管密度+55%、能效+41%的实测收益。麒麟2026首次突破3GHz,昇腾系列将引入逻辑折叠。该路线图预计到2031年等效1.4nm制程密度,从根本上挑战摩尔定律的物理极限。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列:本地运行300B参数模型,但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台(128GB统一内存,支持200B参数模型)及Ryzen AI Max PRO 400系列处理器(首款x86客户端运行300B参数模型)。通过统一内存架构、ROCm优化和OEM合作,推动代理AI从云端走向本地,但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

Cloudflare 其他 2026-05-19

Anthropic与Cloudflare联手解耦AI代理:推理与执行分离成新范式

Anthropic与Cloudflare推出集成,允许Claude Managed Agents在Cloudflare沙箱中执行代码,实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制,支持微VM或轻量级V8 isolate环境,并内置浏览器、电子邮件等工具。

Google 其他 2026-05-18

Google Cloud推MCP托管服务:将AI数据层控制点从SQL转向标准化协议

Google Cloud发布Managed MCP Tools,通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景,从静态API到MCP代理,强调MCP作为开放标准可解耦推理层与数据层,但托管实现深度绑定BigQuery生态。

Cisco 其他 2026-05-14

思科Unified Edge平台:服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台,整合计算、网络、存储和安全,通过Intersight集中管理,面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户,计划将边缘能力捆绑进企业连接服务。

Cisco 其他 2026-05-12

思科用LLM宪法定义取代人工标注,锁定AI安全分类控制权

思科发布Single-Source Safety Definitions,用300+行宪法文档和LLM作为核心评估器,实现AI安全分类一致性。该方法将人工标注压缩为AI驱动,引入意图/内容双轴评估,减少LLM分歧达57倍,并作为Cisco AI Defense产品组合的默认安全分类法。

Cisco 其他 2026-05-07

思科与AMD联合基准测试:将AI网络控制点从GPU移至智能网卡与交换机

思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试,展示在incast拥塞下P01/P99带宽均接近400Gbps线速,证明其架构能消除GPU空转,实现确定性性能。

AMD 其他 强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化

AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

NVIDIA 其他 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

AMD 其他 强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。