筛选

×
当前筛选 清除全部
关键词: TPU ×
67 情报总数
2/4 当前页
NVIDIA 其他 强信号 2026-04-29

英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层

英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。

Google 其他 2026-04-29

Google开放TPU硬件交付,第八代芯片性能跃升直指Nvidia腹地

Google在Q1财报中宣布第八代TPU(TPU 8t/8i),训练性能较前代提升3倍,推理性价比提升80%,并首次计划向客户数据中心直接交付TPU硬件。同时完成Wiz收购,强化AI安全能力。此举标志着Google从云服务商向硬件供应商的战略延伸。

Anthropic 其他 2026-04-29

Anthropic 9000亿估值背后:跨云算力布局如何重塑企业AI采购的厂商锁定风险

Anthropic以9000亿估值融资背后是三云算力布局策略,企业使用Claude实际在同时绑定AWS、Google、NVIDIA三方,厂商锁定风险从单云升级为跨云架构级锁定

ARM 其他 强信号 2026-04-28

Arm发布Performix性能分析工具包,瞄准AI Agent时代优化

Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。

Microsoft 其他 强信号 2026-04-28

微软提出AI Agent成为企业软件主要用户,驱动三层架构重构

微软首席营销官提出,AI Agent正成为企业软件的主要“用户”,这要求软件从用户体验、业务逻辑到数据准备进行三层重构。核心变化在于,软件设计需同时服务人类和Agent,并将业务逻辑封装为Agent可调用的技能。

Microsoft 其他 强信号 2026-04-25

微软将GPT-5.5集成至企业级Copilot,推动多模型工作流编排

微软宣布将GPT-5.5模型部署至GitHub Copilot、Microsoft 365 Copilot、Copilot Studio及Foundry平台。该更新强调多模型编排,允许用户根据任务(如快速探索、深度推理、执行、审查)选择不同模型,并通过‘橡皮鸭’代理实现多模型反思循环。

Google 其他 2026-04-25

Google Cloud Next 2026:Ironwood TPU + $750M Agent Fund

Google在Cloud Next 2026大会上发布第七代TPU Ironwood,峰值算力达42.5 ExaFLOPS,较前代提升10倍。同时宣布7.5亿美元Agent Fund,投资AI智能体生态。主权AI战略成为核心叙事,推出Ironpod超级计算机方案满足政府数据主权需求。

NVIDIA 其他 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

Microsoft 其他 强信号 2026-04-23

微软将Office Copilot代理模式设为默认,推动AI原生工作流

微软宣布Copilot在Word、Excel和PowerPoint中的“代理模式”正式上市并设为默认。该模式允许AI直接在文档画布上进行推理和多步骤操作,标志着从辅助工具到嵌入式AI协作者的转变。

Google 其他 2026-04-22

Google Cloud Next '26:Agent Gateway夺取控制面,TPU 8i锁定推理生态

Google Cloud Next '26 发布第八代TPU(8t训练/8i推理)、Agent Platform(含Agent Gateway、Agent Identity、Agent-to-Agent Orchestration)、Agentic Data Cloud及与Wiz整合的Agentic Defense。核心是将控制点从基础设施转向Agent编排层,以垂直整合堆栈锁定企业AI部署。

Google 其他 2026-04-22

Google Cloud Next 26开幕:发布Agentic Cloud战略

Google Cloud Next 26开幕,发布企业级Agentic AI全栈。

Google 其他 2026-04-22

Google全域算力池化:资源利用率从35%提升至85%

Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。

Google 产品发布 2026-04-22

Google TPU v8发布:单集群算力突破40 ExaFLOPS

Google发布TPU v8芯片,单集群算力达40+ ExaFLOPS,支持百万级Agent并发,算力密度提升3倍,能效比提升2倍。

Cisco 其他 强信号 2026-04-21

思科发布OT安全入门框架,强调经济性与可执行性

思科发布工业OT安全入门框架,针对中型企业资源有限现状,提出分阶段、低成本的实施路径。核心是避免因过度依赖SPAN端口等被动监控架构而产生高昂的隐性基础设施成本,转而利用现有网络设备(如支持Cyber Vision的交换机)实现初步可见性。

Anthropic 其他 中信号 2026-04-17

Anthropic发布Claude Design,整合AI视觉与设计工作流

Anthropic推出Claude Design,通过其最强视觉模型Claude Opus 4.7驱动,允许用户协作创建设计、原型和演示文稿等。该产品面向企业团队,支持从代码库自动构建品牌设计系统,并能将设计无缝移交给Claude Code进行开发。

Microsoft 其他 强信号 2026-04-16

微软提前启用Fairwater超大规模AI数据中心,定义AI基础设施新标准

微软宣布其位于威斯康星州的Fairwater数据中心提前投入运营。该中心被定位为全球最强大的AI数据中心,集成了数十万个NVIDIA GB200 GPU,通过大规模光纤互连构成单一无缝集群,旨在为下一代AI模型训练和推理提供前所未有的算力规模。

Anthropic 其他 强信号 2026-04-16

Anthropic发布Claude Opus 4.7并引入网络安全护栏

Anthropic正式发布Claude Opus 4.7模型,在复杂软件工程、多模态理解和长时推理任务上实现显著提升。该版本首次引入了针对高风险网络安全用途的自动检测与拦截护栏,并为安全研究设立了验证程序,旨在为更强大模型(如Mythos)的广泛发布积累安全经验。

NVIDIA 其他 强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。

Microsoft 其他 强信号 2026-04-14

微软发布高效AI图像模型,成本降低41%并瞄准规模化生产

微软发布MAI-Image-2-Efficient模型,在保持旗舰级质量的同时,推理速度提升22%,效率提升4倍,成本降低41%。该模型定位为规模化生产“主力”,已集成至Microsoft Foundry和Copilot,旨在降低企业AI应用门槛。

ASML 财务新闻 强信号 2026-04-14

瑞银上调博通TPU出货量预测,2027年达700万颗

瑞银因博通与谷歌、Anthropic的合作进展,将博通2027年TPU出货量预测从600万颗上调至700万颗,同步上调未来三年营收、盈利等多项指标预测。印证千兆瓦级TPU合作的真实市场需求。