情报
AI 生成的结构化厂商动态简报
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
NVIDIA IGX Thor边缘AI平台:8倍算力跃迁与ConnectX-7网络锁定
NVIDIA发布IGX Thor系列,基于Blackwell GPU和Arm Neoverse-V3AE CPU,提供最高5,581 FP4 TFLOPS算力、双200GbE RDMA网络及ISO 26262功能安全。通过Jetson/IGX引脚兼容和10年生命周期,构建从原型到生产的无缝迁移路径,但隐性锁定用户至NVIDIA专有硬件堆栈。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
SK海力士HBM4E逻辑芯片跳级至TSMC 3nm,意在狙击三星4nm性能领先
SK海力士计划在第七代HBM4E中采用TSMC 3nm工艺制造逻辑芯片,较HBM4的12nm实现代际跨越。此举旨在扭转在HBM4上性能落后三星(三星采用4nm逻辑)的局面,为NVIDIA Vera Rubin Ultra等下一代AI芯片提供更高带宽与能效。
Meta将AI支持助手与内容审核系统整合,减少对外部供应商依赖
Meta发布AI支持助手,并部署更先进的AI内容审核系统,旨在提升用户体验和平台安全。此举标志着其从依赖外部供应商转向强化内部AI系统,并计划将AI深度融入核心运营流程。
AMD与NAVER Cloud合作推进韩国主权AI基础设施建设
AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。
AMD与三星深化合作,锁定HBM4供应并探索代工
AMD与三星签署谅解备忘录,将三星作为下一代Instinct MI455X GPU的HBM4主要供应商,并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。
HPE报告揭示攻击者商业模式AI化
HPE Threat Labs发布报告,显示网络攻击者采用企业化运营模式,利用自动化和生成式AI加速攻击。基于2025年全球威胁活动分析,强调防御需整合AI和零信任架构。
NVIDIA Project Rheo:用仿真训练医院机器人,控制点从现实转向虚拟
NVIDIA发布Project Rheo蓝图,整合Isaac Sim、GR00T VLA模型和合成数据生成,用于医院机器人自动化。开发者可在数字孪生中训练物理AI策略,包括定位操作(如手术托盘拾取)和精密双手操作(如套管组装),并通过Cosmos Transfer 2.5跨场景泛化。
Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全
Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。
英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力
英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。
NVIDIA Warp:可微分物理模拟框架,打通AI训练与GPU加速
NVIDIA发布Warp框架,允许用Python编写GPU加速的物理模拟代码,并原生支持自动微分。通过2D Navier-Stokes求解器示例,展示了如何将模拟直接集成到AI优化流程中,降低物理AI训练数据生成成本。
Introducing The Anthropic Institute \ Anthropic
AnnouncementsIntroducing The Anthropic InstituteMar 11, 2026We’re launching The Anthropic Institute, a new effort to confront the most significant challenges that powerful AI will pose to our societie...
Fortinet以Agentic AI和统一SOC强化安全运营平台
Fortinet升级其安全运营平台,引入统一SOC界面整合安全警报,部署Agentic AI代理自动化响应任务,并扩展端点保护功能,旨在提升安全团队效率。
Fortinet整合AI代理与SASE于FortiOS 8.0
Fortinet发布FortiOS 8.0,引入基于Fabric的AI代理、安全AI控制、灵活SASE和简化SD-WAN功能,旨在增强企业网络安全的AI集成能力,推动安全控制层向AI驱动转移。
思科展示自主AI框架提升SOC自动化运营
思科在Cisco Live展示自主AI框架,通过自动化处理威胁情报收集、日志整合和事件分类等Tier 1/2分析师任务,显著提升SOC运营效率。该框架在非托管网络环境中成功筛选出高信噪比安全事件,验证了AI代理在安全运营中的实际效能。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。