memory - AI基础设施情报搜索

Anthropic 其他强信号 2026-04-16

Anthropic发布Claude Opus 4.7并引入网络安全护栏

Anthropic正式发布Claude Opus 4.7模型，在复杂软件工程、多模态理解和长时推理任务上实现显著提升。该版本首次引入了针对高风险网络安全用途的自动检测与拦截护栏，并为安全研究设立了验证程序，旨在为更强大模型（如Mythos）的广泛发布积累安全经验。

NVIDIA 其他强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出，涉及硬件、软件、网络的全栈优化，以降低企业AI推理的总拥有成本。

Cisco 其他强信号 2026-04-14

思科阐述AI Agent框架如何重塑网络运维架构

思科通过博客详细阐述了AI Agentic框架在网络工程中的应用，提出从聊天机器人到多步工作流编排的演进路径。其核心在于将人类专业知识编码为‘技能’文件，通过MCP协议连接基础设施API，并在关键步骤设置人工审批点，实现从任务执行到流程编排的角色转变。

Cisco 其他强信号 2026-04-11

思科分享企业AI助手实战模式，强调确定性安全与引导式交互

思科基于其客户体验部门AI助手的18个月实战经验，提炼出决定企业AI系统成败的非显性模式。核心包括：通过确定性代码而非LLM提示词执行RBAC、主动解决企业术语歧义、减少澄清式交互以提升效率，以及基于系统能力提供引导式后续问题。

ARM 其他 2026-04-07

Arm与马来西亚莫纳什大学合作，推进AI时代半导体人才培养

Arm宣布与马来西亚莫纳什大学工程学院合作，捐赠集成电路设计开发板并派遣高管担任客座讲师，旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。

Anthropic 其他强信号 2026-04-06

Anthropic与Mozilla合作，AI模型可独立发现Firefox高危漏洞

Anthropic宣布其Claude Opus 4.6模型在两周内为Mozilla Firefox发现了22个漏洞，其中14个被定为高危。这标志着AI模型已能独立识别复杂软件中的未知安全漏洞，并初步尝试生成漏洞利用，预示AI在网络安全攻防两端的能力均进入新阶段。

ARM 其他强信号 2026-04-03

ARM联合Google优化Gemma 4设备端AI性能

ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行，实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化，推动设备端AI成为移动应用默认架构，降低云端依赖。

Google 其他强信号 2026-04-03

谷歌发布Gemma 4开源模型，瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族，包含从2B到31B的四个版本，强调单位参数性能突破，并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化，旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列，包含四种规模变体，特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言，采用Apache 2.0许可。

AMD 其他强信号 2026-04-02

AMD发布突破性MLPerf 6.0推理结果，展示多节点扩展与多模态能力

AMD在MLPerf Inference 6.0基准测试中，凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型（Wan-2.2-t2v）的快速启用，以及广泛的合作伙伴生态系统复现结果。

Cisco 其他强信号 2026-04-02

Cisco 披露 AI 编码助手内存污染攻击方法

Cisco 安全团队发现并验证了针对 Claude Code 等 AI 编码助手的持久性内存污染攻击方法，通过篡改 MEMORY.md 系统文件可长期操纵 AI 行为。该漏洞已促使 Anthropic 在 v2.1.50 版本中移除了用户记忆文件的系统提示权限。

Intel 其他中信号 2026-04-01

英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能

英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能，特别是在处理大型语言模型（LLM）时的表现。测试结果显示，配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型，并在多GPU设置中提供高达1.8倍的推理性能提升。

ARM 其他强信号 2026-03-27

Arm首次推出自研AGI CPU，进军数据中心硅产品市场

Arm宣布其计算平台首次扩展至生产级硅产品，推出自研的Arm AGI CPU，专为AI数据中心和Agentic AI工作负载设计。该CPU旨在提供远超x86平台的每机架性能与能效，并已获得Meta、OpenAI等关键客户及广泛OEM/ODM生态支持。

NVIDIA 其他强信号 2026-03-26

NVIDIA推出物理AI数据工厂蓝图，将计算转化为合成数据

NVIDIA在GTC上发布物理AI数据工厂蓝图，这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器，旨在解决真实世界数据难以规模化获取和处理的瓶颈，为下一代自主系统和机器人提供数据引擎。

ARM 其他强信号 2026-03-25

ARM推出AGI CPU：AI Agent时代的硅基础

ARM宣布推出Arm AGI CPU，这是其首款自有硅产品，基于Neoverse平台，专为agentic AI时代设计。该CPU优化大规模并行工作负载，在1OU配置中支持272核心/刀片，全机架达8160核心，性能比x86系统提高两倍以上，提升AI基础设施效率。

ARM 其他强信号 2026-03-25

ARM Neoverse重塑AI基础设施控制层

ARM推出Neoverse系列基础设施CPU核心，专为云计算、AI和高性能计算优化，被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台，实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署，强化安全多租户支持。

NVIDIA 其他强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配（DRA）驱动捐献给CNCF，使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区，并协同多家云厂商推动标准化。

NVIDIA 其他 2026-03-24

NVIDIA IGX Thor边缘AI平台：8倍算力跃迁与ConnectX-7网络锁定

NVIDIA发布IGX Thor系列，基于Blackwell GPU和Arm Neoverse-V3AE CPU，提供最高5,581 FP4 TFLOPS算力、双200GbE RDMA网络及ISO 26262功能安全。通过Jetson/IGX引脚兼容和10年生命周期，构建从原型到生产的无缝迁移路径，但隐性锁定用户至NVIDIA专有硬件堆栈。

ARM 其他强信号 2026-03-24

ARM与NVIDIA推动AI工作站本地化变革

ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列，八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行，第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度，实现云端工具链向边缘端无缝迁移。

Samsung Electronics 其他 2026-03-20

SK海力士HBM4E逻辑芯片跳级至TSMC 3nm，意在狙击三星4nm性能领先

SK海力士计划在第七代HBM4E中采用TSMC 3nm工艺制造逻辑芯片，较HBM4的12nm实现代际跨越。此举旨在扭转在HBM4上性能落后三星（三星采用4nm逻辑）的局面，为NVIDIA Vera Rubin Ultra等下一代AI芯片提供更高带宽与能效。

情报

筛选