Filter

×
当前筛选 清除全部
关键词: inference ×
93 情报总数
1/5 当前页
Amazon Other 强信号 2026-05-15

亚马逊Bedrock推出高级提示优化与模型迁移工具

亚马逊在Bedrock服务中推出高级提示优化工具,支持用户通过基于指标反馈循环自动优化提示词,并可同时在最多5个模型上进行测试与迁移评估。该工具整合了Lambda函数、LLM-as-a-Judge和自然语言指导等多种评估方法。

Cisco Other 强信号 2026-05-14

思科推动服务商将边缘基础设施转型为AI服务平台

思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。

NVIDIA Other 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

Cisco Other 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

AMD Other 中信号 2026-05-12

AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定

AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。

Hewlett Packard Enterprise Other 中信号 2026-05-12

HPE整合私有云与数据平台,强化AI数据就绪能力

HPE宣布其GreenLake平台的多项更新,旨在通过统一的私有云、存储和数据保护方案,帮助企业现代化基础设施并加速AI数据就绪。核心动作包括整合Kubernetes管理、统一文件与对象存储,并引入跨存储与数据保护产品的智能代理能力。

NVIDIA Other 强信号 2026-05-12

NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。

NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。

Microsoft Other 强信号 2026-05-12

微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化

微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。

AMD Other 强信号 2026-05-12

AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署

AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。

AMD Other 强信号 2026-05-12

AMD定义AI网络概念并推出专用AI NIC

AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。

Fortinet Other 强信号 2026-05-12

Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全

Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。

Google Other 强信号 2026-05-11

谷歌公共部门阐述AI代理时代基础设施、数据与安全架构

谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。

Google Other 强信号 2026-05-11

Google揭示AI驱动攻击产业化:从漏洞发现到自主执行

Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。

AMD Other 强信号 2026-05-08

AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比

AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。

Cisco Other 强信号 2026-05-07

思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力

思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。

AMD Other 强信号 2026-05-07

AMD提出Agentic AI驱动数据中心CPU与GPU架构分离

AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。

ARM Other 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

AMD Other 中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。

AMD Other 强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化

AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

AMD Other 强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。