筛选

×
当前筛选 清除全部
关键词: 推理 ×
147 情报总数
3/8 当前页
Amazon 合作伙伴 强信号 2026-04-15

AWS与OpenAI签署380亿美元AI云合作

OpenAI与AWS签署7年期380亿美元协议,部署数千块NVIDIA GB200/GB300 GPU。OpenAI首次重大多元化Azure基础设施。

Meta 其他 强信号 2026-04-14

Meta与Broadcom达成多年2nm AI芯片合作,初始部署超1GW

Meta与Broadcom宣布多年多代战略合作,共同开发MTIA(Meta Training and Inference Accelerator)芯片,合作延续至2029年。首批部署超过1GW,后续扩展至数吉瓦级别。这是业界首个2nm工艺AI计算加速器,基于Broadcom XPU平台深度定制。Meta已规划MTIA 300/400/450/500四个迭代版本,主要用于推荐算法、内容排序和大规模AI推理。Broadcom CEO陈福阳将退出Meta董事会以规避利益关联,转为战略顾问。

Google 产品发布 中信号 2026-04-09

Google Cloud Next 2026:企业AI代理平台"登堂入室"的标志性时刻

Google Cloud Next 2026代表了AI平台竞争的"登堂入室"时刻。Gemini Enterprise Agent Platform的发布表明,大型云厂商已从"提供AI能力"转向"提供AI工作流"。平台捆绑战正式开打,企业需要在"功能完整性"和"供应商锁定风险"之间做出选择。

Meta 其他 强信号 2026-04-08

Meta发布Muse Spark基础模型并重构AI助手架构

Meta推出其Superintelligence Labs的首个模型Muse Spark,并以此为核心全面升级Meta AI助手。新架构支持并行子代理(subagents)协同推理、强大的多模态感知能力,并能调用社交图谱内容提供个性化答案。

Intel 其他 强信号 2026-04-08

英特尔与SambaNova联合发布面向Agentic AI的异构推理架构

英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。

Anthropic 其他 强信号 2026-04-06

Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力

Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。

NVIDIA 其他 强信号 2026-04-03

英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施

英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。

NVIDIA 其他 中信号 2026-04-03

NVIDIA 优化 Gemma 4 模型以加速本地代理 AI

NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。

Google 其他 强信号 2026-04-03

谷歌为Gemini API引入Flex与Priority推理层级

谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级,为延迟容忍型工作负载提供同步接口,价格降低50%;Priority为高可靠性层级,确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面,让开发者根据AI任务类型(如后台Agent思考与前台交互)灵活平衡成本与可靠性。

Google 其他 强信号 2026-04-03

谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他 中信号 2026-04-03

Google为Gemini API推出Flex和Priority推理层级

Google在其Gemini API中新增Flex和Priority两个服务层级,允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约,而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。

Cisco 其他 中信号 2026-04-02

思科推出AI就绪宽带解决方案应对边缘计算挑战

思科发布Agile Services Networking和Unified Edge平台,旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力,减少核心网络负载,并支持智能流量优先级管理。

AMD 其他 中信号 2026-04-02

AMD 在 MLPerf 推理测试中取得突破性成绩

AMD 宣布其 Instinct MI300X 加速器在 MLPerf Inference 6.0 基准测试中表现优异,特别是在自然语言处理任务上创下新纪录。这表明 AMD 在 AI 推理基础设施领域的技术竞争力显著提升。

Intel 其他 中信号 2026-04-01

英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能

英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。

Cisco 其他 强信号 2026-03-31

思科推出统一AI网络架构应对训练与推理流量冲突

思科提出统一AI网络架构解决方案,通过N9000系列交换机实现训练和推理流量的智能调度,解决传统双架构模式下的资源浪费问题。该方案包含硅级低延迟支持、实时遥测和自动化策略调整能力,瞄准新兴云服务商的平台化转型需求。

OpenAI 其他 强信号 2026-03-31

OpenAI 融资1220亿美元加速全球AI基础设施建设

OpenAI宣布获得1220亿美元融资,将用于扩展全球前沿AI能力、投资下一代计算基础设施,并满足ChatGPT、Codex和企业级AI的快速增长需求。这笔创纪录融资将显著提升其AI训练集群和推理基础设施的建设规模。

NVIDIA 其他 中信号 2026-03-31

NVIDIA 通过 NVLink Fusion 扩展 AI 生态系统

NVIDIA 宣布 Marvell 加入其 AI 生态系统,通过 NVLink Fusion 技术实现更高效的 AI 计算互连。这一合作将提升大规模 AI 训练和推理场景下的数据传输效率。

NVIDIA 其他 强信号 2026-03-26

NVIDIA发布物理AI数据工厂蓝图及前沿模型

NVIDIA在GTC 2026发布三大物理AI前沿模型和Physical AI Data Factory开放参考架构,通过Cosmos世界模型和OSMO操作符将计算转化为合成训练数据。同时推出Omniverse DSX数字孪生仿真蓝图,工业机器人厂商正采用该框架验证应用并集成Jetson模块实现实时AI推理。

Cisco 其他 中信号 2026-03-26

思科推出统一边缘平台推动医疗AI本地推理合规部署

思科推出Unified Edge统一边缘平台,支持医疗AI模型在数据源端进行本地推理,确保数据驻留临床环境内。该平台提供集中治理能力,实现低延迟诊断与合规要求平衡。合作伙伴案例显示可将心脏MRI分析时间从1小时缩短至10分钟。

Intel 其他 中信号 2026-03-25

英特尔发布18A制程商用PC平台,强化AI推理能力

英特尔发布基于18A制程的酷睿Ultra 3系列商用PC处理器,AI性能较前代提升4倍。同步推出Arc Pro B70独立显卡,针对企业AI工作负载优化,在上下文窗口和多用户响应方面优于竞品。vPro平台与Intune深度集成提升企业设备管理效率。