情报
AI 生成的结构化厂商动态简报
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
思科开源AI Agent安全治理工具DefenseClaw
思科推出开源工具DefenseClaw,为OpenClaw等AI Agent提供三层安全防护架构:供应链扫描、运行时检测和系统边界控制。该方案整合了NVIDIA的OpenShell沙箱技术,实现从安装到运行的全周期自动化安全治理。
Arm首次推出自研AGI CPU,进军数据中心硅产品市场
Arm宣布其计算平台首次扩展至生产级硅产品,推出自研的Arm AGI CPU,专为AI数据中心和Agentic AI工作负载设计。该CPU旨在提供远超x86平台的每机架性能与能效,并已获得Meta、OpenAI等关键客户及广泛OEM/ODM生态支持。
OpenAI发布Model Spec框架,公开AI行为准则
OpenAI发布Model Spec框架,公开AI模型行为规则,旨在平衡有益性、安全性和用户自主权。该框架文档化并开放于GitHub,促进AI行为准则的标准化讨论。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
CrowdStrike 披露 GitHub Actions 供应链攻击事件
CrowdStrike 威胁情报团队披露针对 Trivy 漏洞扫描工具的 GitHub Action 供应链攻击,攻击者通过账户劫持注入恶意代码窃取敏感凭证。事件凸显 CI/CD 管道中第三方依赖的高风险性,要求企业加强 Actions 组件安全审查与运行时监控。
英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力
英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。
思科推出DevNet语义搜索MCP服务器,集成IDE提升开发者体验
思科发布基于模型上下文协议(MCP)的DevNet Content Search服务器,将思科API文档语义搜索功能直接集成至开发者IDE环境。当前支持Meraki和Catalyst Center的API文档搜索,提供一键安装和实时API上下文支持。该工具通过降低API使用错误率提升开发效率,但生成的代码仍需人工审查。
NVIDIA Warp:可微分物理模拟框架,打通AI训练与GPU加速
NVIDIA发布Warp框架,允许用Python编写GPU加速的物理模拟代码,并原生支持自动微分。通过2D Navier-Stokes求解器示例,展示了如何将模拟直接集成到AI优化流程中,降低物理AI训练数据生成成本。
英特尔发布工业级Core Series 2处理器与医疗AI套件强化边缘AI
英特尔发布工业级Core Series 2处理器,针对边缘关键任务应用提供确定性性能,显著改善实时响应与PCIe延迟。同时推出第六个Edge AI套件,专注于医疗健康领域,提供多模态AI工作负载参考实现。
思科推动多厂商网络自动化与AI工作流集成
思科通过DevNet活动展示基于开放标准和AI代理的多厂商网络自动化架构,集成OpenConfig/gNMI数据模型和MCP服务器,实现从配置管理到智能ChatOps的完整工作流。该方案强调跨厂商互操作性和自然语言驱动的运维自动化。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍,锁定Blackwell生态
NVIDIA与Black Forest Labs合作,在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile,将FLUX.2推理延迟较H200降低6.3x(单卡)至10.2x(双卡),内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。
NVIDIA发布交互式AI Agent:用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学
NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent,通过自然语言接口编排数据科学工作流,实现从数据加载到模型训练的端到端GPU加速,性能提升3-43倍。
NVIDIA发布教程将轻量级LLM转化为终端AI代理
NVIDIA通过开发者博客发布教程,指导用户利用其开源的Nemotron Nano v2模型,在约200行Python代码内构建一个能理解自然语言并执行Bash命令的AI代理。该教程强调从零构建和利用LangGraph简化,核心在于实现安全的工具调用(Tool Calling)和人机回圈(Human-in-the-Loop)控制。
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。
趋势科技揭示Azure DNS设计缺陷暴露云基础设施接管风险
趋势科技旗下TrendAI™研究团队披露了Azure云平台中一个“设计使然”的安全漏洞。已删除的Azure资源其DNS记录可能被持久保留,攻击者可利用这些残留的DNS名称,接管受信任的端点并入侵依赖系统,揭示了云基础设施中一个关键但常被忽视的信任继承风险。
微软GitHub向AWS租用算力:AI需求引爆跨云协作,打破云厂商竞争壁垒
微软旗下GitHub因AI辅助编程需求暴涨14倍,被迫向竞争对手AWS租用计算容量。此举暴露单一云厂商无法满足AI基础设施需求,打破传统云竞争格局,预示跨云混合部署成为新常态。