Filter

×
当前筛选 清除全部
关键词: TPU ×
81 情报总数
2/5 当前页
NVIDIA Other 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA Other 强信号 2026-05-05

NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈

NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。

Cisco Other 强信号 2026-05-05

思科推出Agentic Workflows,将AI Agent理念引入网络自动化

思科发布Agentic Workflows,旨在为现有Ansible、Terraform、Python自动化工具栈提供一个统一的、支持AI驱动的智能编排层。该平台通过可视化、低代码设计、内置审批与AI辅助,将网络自动化从任务执行转向结果驱动的编排。

NVIDIA Other 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

Google Other 强信号 2026-05-04

谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”

谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。

Microsoft Other 强信号 2026-05-02

微软发布Agent 365,为AI智能体引入企业级身份与治理层

微软宣布其Agent 365平台全面上市,核心动作是将企业现有的身份(Entra)、安全、治理和管理系统扩展至AI智能体及其在企业内的所有交互。此举旨在解决AI智能体规模化部署带来的身份、安全和合规挑战。

NVIDIA Other 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

NVIDIA Other 强信号 2026-05-01

英伟达发布DLSS 4.5 SDK及TensorRT for RTX插件,深化游戏AI渲染生态

英伟达向开发者开放DLSS 4.5 SDK,包含动态多帧生成和6X多帧生成模式,并推出用于虚幻引擎NNE的TensorRT for RTX插件,加速游戏内AI推理。同时,其研究项目Kimodo展示了文本生成3D角色动画的潜力。

NVIDIA Other 中信号 2026-04-30

NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移

NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。

Intel Other 强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化

英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。

Cloudflare Other 强信号 2026-04-30

Cloudflare推动后量子IPsec标准落地,与思科、飞塔实现互操作

Cloudflare宣布其IPsec服务全面支持基于IETF草案的混合ML-KEM后量子加密,并与思科、飞塔的硬件设备实现互操作。此举旨在应对“先窃取后解密”攻击,并推动IPsec社区从依赖专用硬件的QKD方案,转向基于软件、可大规模互操作的后量子密码学标准。

NVIDIA Other 强信号 2026-04-29

英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层

英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。

Google Other 强信号 2026-04-29

谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长

谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。

Anthropic Other 2026-04-29

Anthropic 9000亿估值背后:跨云算力布局如何重塑企业AI采购的厂商锁定风险

Anthropic以9000亿估值融资背后是三云算力布局策略,企业使用Claude实际在同时绑定AWS、Google、NVIDIA三方,厂商锁定风险从单云升级为跨云架构级锁定

ARM Other 强信号 2026-04-28

Arm发布Performix性能分析工具包,瞄准AI Agent时代优化

Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。

Microsoft Other 强信号 2026-04-28

微软提出AI Agent成为企业软件主要用户,驱动三层架构重构

微软首席营销官提出,AI Agent正成为企业软件的主要“用户”,这要求软件从用户体验、业务逻辑到数据准备进行三层重构。核心变化在于,软件设计需同时服务人类和Agent,并将业务逻辑封装为Agent可调用的技能。

Microsoft Other 强信号 2026-04-25

微软将GPT-5.5集成至企业级Copilot,推动多模型工作流编排

微软宣布将GPT-5.5模型部署至GitHub Copilot、Microsoft 365 Copilot、Copilot Studio及Foundry平台。该更新强调多模型编排,允许用户根据任务(如快速探索、深度推理、执行、审查)选择不同模型,并通过‘橡皮鸭’代理实现多模型反思循环。

Google Other 2026-04-25

Google Cloud Next 2026:Ironwood TPU + $750M Agent Fund

Google在Cloud Next 2026大会上发布第七代TPU Ironwood,峰值算力达42.5 ExaFLOPS,较前代提升10倍。同时宣布7.5亿美元Agent Fund,投资AI智能体生态。主权AI战略成为核心叙事,推出Ironpod超级计算机方案满足政府数据主权需求。

NVIDIA Other 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

Microsoft Other 强信号 2026-04-23

微软将Office Copilot代理模式设为默认,推动AI原生工作流

微软宣布Copilot在Word、Excel和PowerPoint中的“代理模式”正式上市并设为默认。该模式允许AI直接在文档画布上进行推理和多步骤操作,标志着从辅助工具到嵌入式AI协作者的转变。