筛选

×
当前筛选 清除全部
关键词: 推理 ×
147 情报总数
6/8 当前页
Google 其他 中信号 2026-03-04

谷歌推出高效推理模型Gemini 3.1 Flash-Lite

谷歌发布Gemini 3.1 Flash-Lite模型,针对大规模高频率工作负载优化,实现2.5倍首次响应速度提升和45%输出速度增长。该模型通过AI Studio和Vertex AI提供,支持思考层级调整功能,适用于翻译、内容审核等规模化AI应用。

Huawei 其他 强信号 2026-03-04

华为发布AI数据平台采用存算分离架构

华为发布专为AI工作负载设计的数据平台,采用存算分离架构提升数据流动效率。平台集成高性能文件系统支持EB级数据,内置加速引擎可缩短AI训练数据准备时间30%。提供统一数据管理视图,无缝对接主流AI框架和昇腾计算硬件。

AMD 其他 中信号 2026-03-04

AMD发布Vitis统一软件平台加速AI与HPC开发

AMD发布Vitis统一软件平台,通过高级语言编程模型简化FPGA和自适应SoC应用开发。平台集成AI推理、数据分析等优化库,支持主流AI框架并提供性能分析工具。此举降低了异构计算开发门槛,推动AI应用普及。

AMD 其他 中信号 2026-03-04

AMD强化Vivado与Vitis平台集成推动软硬件协同设计

AMD Vivado设计套件通过与Vitis统一软件平台深度集成,提供从高层次综合到系统级集成的完整开发环境。该平台强化了基于IP的设计复用能力,支持FPGA、自适应SoC和ACAP的软硬件协同开发。

Apple 其他 中信号 2026-03-03

苹果M5芯片集成神经加速器强化本地AI推理

苹果发布M5 Pro和M5 Max芯片,采用Fusion架构集成双晶粒SoC,每个GPU核心内置神经加速器,AI性能相比前代提升4倍。统一内存带宽最高614GB/s,支持128GB内存,针对本地LLM处理和AI模型训练优化。

Cisco 其他 中信号 2026-03-03

思科通过VoidLink分析推动eBPF内核安全架构

思科基于VoidLink恶意软件框架分析,揭示云原生和AI工作负载安全盲点,强调传统终端安全和云安全方案存在可视性缺口。公司通过旗下Isovalent的Hypershield解决方案,展示eBPF内核级运行时安全技术对容器和Kubernetes环境的防护价值。

OpenAI 其他 中信号 2026-03-03

OpenAI发布GPT-5.3系统卡强化模型透明度与可控性

OpenAI发布GPT-5.3 Instant系统卡,详细披露模型安全护栏、对抗防御和可操纵性技术细节。该文档标准化模型能力披露,支持开发者通过系统提示精确引导AI行为。此举体现OpenAI从性能导向向负责任AI治理的战略延伸。

Intel 其他 中信号 2026-03-03

英特尔展示至强6统一平台支撑AI就绪网络架构

英特尔在MWC 2026展示基于至强6处理器的统一计算平台,实现Cloud RAN、AI推理和媒体处理在同一CPU上运行。该架构避免了专用硬件需求,为运营商提供平滑的5G向AI-native 6G演进路径。

Palo Alto Networks 其他 强信号 2026-03-02

Palo Alto Networks 提出服务提供商转型安全AI工厂战略

Palo Alto Networks 提出服务提供商应转型为'安全AI工厂',构建集成AI开发、部署、治理和安全防护的综合性平台。该平台强调内嵌式安全层,提供针对模型投毒、数据泄露的主动防护,将安全从防御成本重构为商业赋能核心。

AMD 其他 中信号 2026-03-02

AMD发布Vitis AI开发者工具强化AI推理生态

AMD发布Vitis AI开发者工具套件,为其自适应计算平台提供统一的AI开发环境。该工具支持主流深度学习框架,提供模型优化、量化和编译功能,旨在降低AI模型在AMD硬件上的部署门槛。

AMD 其他 中信号 2026-03-02

AMD推出企业AI套件强化硬件软件整合

AMD发布企业AI套件,整合硬件与软件生态系统,提供从模型优化到部署的端到端工具链。该套件针对Instinct加速器和Ryzen AI处理器优化,旨在提升AI工作负载性能并降低开发复杂性。

AMD 其他 中信号 2026-03-02

AMD发布Ryzen AI软件套件构建端侧AI开发生态

AMD推出Ryzen AI软件套件,为开发者提供完整的文档门户和工具支持,围绕XDNA架构AI引擎构建开发生态。该举措系统化连接硬件AI能力与终端应用,降低开发门槛,推动端侧AI推理部署。

AMD 其他 中信号 2026-03-02

AMD推出ROCm AI开发者中心强化软件生态

AMD推出ROCm AI开发者中心,提供集中化软件工具和资源平台,支持开发者在AMD GPU上进行AI模型训练和推理优化。该平台通过文档、工具和最佳实践简化开发流程,提升从开发到部署的效率。

NVIDIA 其他 强信号 2026-03-01

英伟达发布电信行业AI代理蓝图与推理模型

英伟达推出面向电信行业的Agentic AI蓝图和专用推理模型,基于NeMo框架构建的领域大语言模型可自主处理网络运维任务。该方案通过预训练模型降低部署门槛,推动电信网络向自主化架构演进。

Fortinet 产品发布 强信号 2026-03-01

FortiOS 8.0 FortiAI:RAG驱动的智能运维助手深度解析

FortiOS 8.0首次将FortiAI-Assist智能助手深度嵌入FortiGate操作系统,提供基于RAG架构的文档问答、故障诊断和CLI命令生成能力。支持FortiAI和OpenAI双提供商模式,采用Token计费。

Huawei 其他 中信号 2026-02-28

华为联合帆软推出AI+BI融合方案,聚焦金融智能决策

华为与帆软联合发布ChatBI智能决策方案,结合华为云盘古大模型和ModelArts平台与帆软FineBI数据处理能力,通过自然语言交互简化金融数据查询与分析流程。该方案针对风控、营销等场景优化,旨在降低数据分析门槛,提升决策效率。

AMD 其他 强信号 2026-02-28

AMD获Meta 6吉瓦GPU部署订单,强化AI加速器竞争

AMD与Meta达成战略合作,将部署6吉瓦Instinct MI300系列GPU算力,用于支持AI训练与推理工作负载。该合作包括硬件部署和ROCm软件栈优化,提升AI基础设施性能。

AMD 其他 中信号 2026-02-28

AMD与TCS合作在印度部署Helios AI机架架构

AMD与塔塔咨询合作,在印度市场推出基于Instinct MI300加速器的Helios机架级AI架构,支持大规模AI训练和推理工作负载。该解决方案以完整机架形式交付,可扩展至数千节点集群,专为生成式AI和HPC优化。合作结合TCS的云、AI和网络安全集成服务,提供端到端AI解决方案。

AMD 其他 中信号 2026-02-28

AMD发布CDNA 4架构加速卡MI430X强化AI算力

AMD发布基于CDNA 4架构的Instinct MI430X加速卡,集成增强矩阵核心和FP8精度支持,针对大语言模型训练和推理优化。采用HBM3e内存和Infinity Fabric互连技术,提升AI工作负载性能与能效。

Amazon 其他 强信号 2026-02-28

AWS发布Inferentia2推理芯片优化生成式AI基础设施

亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。