GitHub - AI基础设施情报搜索

Google 其他中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列，包含四种规模变体，特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言，采用Apache 2.0许可。

Cisco 其他中信号 2026-03-31

思科开源AI Agent安全治理工具DefenseClaw

思科推出开源工具DefenseClaw，为OpenClaw等AI Agent提供三层安全防护架构：供应链扫描、运行时检测和系统边界控制。该方案整合了NVIDIA的OpenShell沙箱技术，实现从安装到运行的全周期自动化安全治理。

ARM 其他强信号 2026-03-27

Arm首次推出自研AGI CPU，进军数据中心硅产品市场

Arm宣布其计算平台首次扩展至生产级硅产品，推出自研的Arm AGI CPU，专为AI数据中心和Agentic AI工作负载设计。该CPU旨在提供远超x86平台的每机架性能与能效，并已获得Meta、OpenAI等关键客户及广泛OEM/ODM生态支持。

OpenAI 其他中信号 2026-03-25

OpenAI发布Model Spec框架，公开AI行为准则

OpenAI发布Model Spec框架，公开AI模型行为规则，旨在平衡有益性、安全性和用户自主权。该框架文档化并开放于GitHub，促进AI行为准则的标准化讨论。

NVIDIA 其他强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配（DRA）驱动捐献给CNCF，使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区，并协同多家云厂商推动标准化。

NVIDIA 其他强信号 2026-03-23

英伟达推出OpenShell，为自主AI代理建立运行时安全沙盒

英伟达发布开源项目OpenShell，旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型，在系统层面隔离代理操作与策略执行，防止策略被覆盖或数据泄露。此举与多家安全厂商合作，推动企业级AI代理的统一策略层。

Cisco 其他强信号 2026-03-23

思科扩展零信任安全至AI代理生态

思科在RSA 2026宣布针对AI代理的安全创新，扩展Zero Trust Access至非人类身份，引入agentic IAM在Duo、MCP策略执行于Secure Access SSE，并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架，以自动化安全部署。

CrowdStrike 其他强信号 2026-03-20

CrowdStrike 披露 GitHub Actions 供应链攻击事件

CrowdStrike 威胁情报团队披露针对 Trivy 漏洞扫描工具的 GitHub Action 供应链攻击，攻击者通过账户劫持注入恶意代码窃取敏感凭证。事件凸显 CI/CD 管道中第三方依赖的高风险性，要求企业加强 Actions 组件安全审查与运行时监控。

NVIDIA 其他强信号 2026-03-14

英伟达发布Cosmos世界模型套件，强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型（WFM）套件的重要更新，包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据，并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理，以解决真实世界数据稀缺的瓶颈。

Cisco 其他 2026-03-13

思科推出DevNet语义搜索MCP服务器，集成IDE提升开发者体验

思科发布基于模型上下文协议（MCP）的DevNet Content Search服务器，将思科API文档语义搜索功能直接集成至开发者IDE环境。当前支持Meraki和Catalyst Center的API文档搜索，提供一键安装和实时API上下文支持。该工具通过降低API使用错误率提升开发效率，但生成的代码仍需人工审查。

NVIDIA 其他 2026-03-13

NVIDIA Warp：可微分物理模拟框架，打通AI训练与GPU加速

NVIDIA发布Warp框架，允许用Python编写GPU加速的物理模拟代码，并原生支持自动微分。通过2D Navier-Stokes求解器示例，展示了如何将模拟直接集成到AI优化流程中，降低物理AI训练数据生成成本。

Intel 其他中信号 2026-03-10

英特尔发布工业级Core Series 2处理器与医疗AI套件强化边缘AI

英特尔发布工业级Core Series 2处理器，针对边缘关键任务应用提供确定性性能，显著改善实时响应与PCIe延迟。同时推出第六个Edge AI套件，专注于医疗健康领域，提供多模态AI工作负载参考实现。

Cisco 其他中信号 2026-03-05

思科推动多厂商网络自动化与AI工作流集成

思科通过DevNet活动展示基于开放标准和AI代理的多厂商网络自动化架构，集成OpenConfig/gNMI数据模型和MCP服务器，实现从配置管理到智能ChatOps的完整工作流。该方案强调跨厂商互操作性和自然语言驱动的运维自动化。

NVIDIA 其他中信号 2026-03-04

NVIDIA将CUDA Tile编程模型扩展至Julia语言

NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛，通过数据块抽象简化底层线程与内存管理，并保持与Python版本在语法和性能上的高度一致性。

NVIDIA 其他 2026-01-23

NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍，锁定Blackwell生态

NVIDIA与Black Forest Labs合作，在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile，将FLUX.2推理延迟较H200降低6.3x（单卡）至10.2x（双卡），内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。

NVIDIA 其他 2025-11-08

NVIDIA发布交互式AI Agent：用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学

NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent，通过自然语言接口编排数据科学工作流，实现从数据加载到模型训练的端到端GPU加速，性能提升3-43倍。

NVIDIA 其他中信号 2025-10-22

NVIDIA发布教程将轻量级LLM转化为终端AI代理

NVIDIA通过开发者博客发布教程，指导用户利用其开源的Nemotron Nano v2模型，在约200行Python代码内构建一个能理解自然语言并执行Bash命令的AI代理。该教程强调从零构建和利用LangGraph简化，核心在于实现安全的工具调用（Tool Calling）和人机回圈（Human-in-the-Loop）控制。

Google 其他强信号 2020-10-11

Google Cloud推出MCP与Apigee集成及Agentic Platform，推动企业API向AI Agent化演进

Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用，并推出Agentic Platform，旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施，为企业从API驱动转向Agent驱动架构提供了核心平台能力。

Trend Micro 其他强信号 2020-06-01

趋势科技揭示Azure DNS设计缺陷暴露云基础设施接管风险

趋势科技旗下TrendAI™研究团队披露了Azure云平台中一个“设计使然”的安全漏洞。已删除的Azure资源其DNS记录可能被持久保留，攻击者可利用这些残留的DNS名称，接管受信任的端点并入侵依赖系统，揭示了云基础设施中一个关键但常被忽视的信任继承风险。

Microsoft 其他 1970-01-01

微软GitHub向AWS租用算力：AI需求引爆跨云协作，打破云厂商竞争壁垒

微软旗下GitHub因AI辅助编程需求暴涨14倍，被迫向竞争对手AWS租用计算容量。此举暴露单一云厂商无法满足AI基础设施需求，打破传统云竞争格局，预示跨云混合部署成为新常态。

情报

筛选