筛选

×
当前筛选 清除全部
关键词: AI inference ×
35 情报总数
1/2 当前页
Intel 其他 2026-06-02

英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权

英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。

NVIDIA 其他 2026-06-01

NVIDIA BlueField DPU硬件隔离安全:将AI工厂控制点从软件转向硅片

NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈(Argus、Vault、Flow),通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片,在不影响AI性能前提下提供分布式全栈保护,但深度绑定Vera Rubin平台,形成生态锁定。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态

NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。

Intel 其他 2026-06-01

Intel以Xeon 6+与E835重塑AI控制平面:CPU重新成为agentic AI的编排核心

Intel发布基于Intel 18A的Xeon 6+处理器(288个E-core)、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心,作为agentic AI工作负载的编排与数据移动控制平面,并试图通过E835以太网组合锁定AI数据中心网络标准。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台,A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包,包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform,提供从低代码到代码优先的四层开发阶梯,旨在通过共享协议层统一本地开发与云端部署,但实质是将agent生命周期控制权集中于谷歌云管理平面。

Cisco 其他 2026-05-14

思科Unified Edge平台:服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台,整合计算、网络、存储和安全,通过Intersight集中管理,面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户,计划将边缘能力捆绑进企业连接服务。

Cisco 其他 2026-05-07

思科与AMD联合基准测试:将AI网络控制点从GPU移至智能网卡与交换机

思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试,展示在incast拥塞下P01/P99带宽均接近400Gbps线速,证明其架构能消除GPU空转,实现确定性性能。

ARM 其他 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

Intel 其他 中信号 2026-05-06

英特尔在Computex 2026强调CPU在AI计算中的关键角色

英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。

Intel 其他 中信号 2026-05-04

英特尔任命新领导层,整合客户端计算与物理AI业务

英特尔任命Alex Katouzian为客户端计算与物理AI业务总经理,并任命Pushkar Ranade为CTO。此举旨在将传统PC业务与机器人、自主机器等物理AI系统对齐,并推动量子计算等前沿技术研发。

Cisco 其他 强信号 2026-05-01

思科发布AI网络流量报告,揭示智能体AI对广域网的根本性影响

思科基于真实网络流量数据发布研究报告,首次量化分析智能体AI对广域网流量模式、对称性及关键路径的颠覆性影响,并预测到2035年AI推理流量将占网络总流量的25%。

Intel 其他 强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化

英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

AMD 其他 强信号 2026-04-29

AMD与Liquid AI探讨从芯片到系统的高效AI架构

AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。

Cisco 其他 强信号 2026-04-28

思科借硬件更新周期推动AI就绪数据中心架构

思科通过博客指出,企业AI战略受阻的核心在于数据中心基础设施。其主张将AI就绪性融入常规硬件更新周期,强调通过统一运营、网络内嵌安全、端到端可观测性及高性能网络来构建AI基础设施。

Microsoft 其他 强信号 2026-04-28

微软发布Azure Local大规模扩展,支持主权私有云部署数千节点

微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。

Google 其他 2026-04-22

Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态

Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。

Cisco 其他 强信号 2026-04-16

思科携手英伟达,将网络升级为AI媒体处理的控制平面

思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。

NVIDIA 其他 强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。