情报
AI 生成的结构化厂商动态简报
HPE与NVIDIA深化AI工厂合作,推出全栈式超算解决方案
HPE在GTC 2026上宣布升级与NVIDIA的AI计算产品组合,推出面向大规模AI工厂和超级计算机的全栈解决方案,整合计算、GPU、网络、液冷、软件与服务,旨在提升部署效率与洞察速度。
HPE提出AI数据管道即平台,强调企业AI生产化支柱
HPE提出企业AI正从实验转向生产,其成功依赖于由数据管道、统一存储和加速计算构成的基础设施平台。该公司强调,持续性能、可预测扩展和长期成本效益是三大核心支柱,旨在解决生产环境中AI工作负载的复杂性问题。
NVIDIA Warp:可微分物理模拟框架,打通AI训练与GPU加速
NVIDIA发布Warp框架,允许用Python编写GPU加速的物理模拟代码,并原生支持自动微分。通过2D Navier-Stokes求解器示例,展示了如何将模拟直接集成到AI优化流程中,降低物理AI训练数据生成成本。
Introducing The Anthropic Institute \ Anthropic
AnnouncementsIntroducing The Anthropic InstituteMar 11, 2026We’re launching The Anthropic Institute, a new effort to confront the most significant challenges that powerful AI will pose to our societie...
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
苹果推出AI操作系统集成架构与私有云推理基础设施
苹果发布Apple Intelligence,采用设备端与云端混合处理模型,通过Private Cloud Compute架构提供AI推理服务。该系统深度集成于操作系统层面,实现隐私保护的AI功能交付。
思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础
思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。
NVIDIA用NVFP4量化+TeaCache将FLUX.2推理提速10倍,锁定Blackwell生态
NVIDIA与Black Forest Labs合作,在DGX B200/B300上通过NVFP4 4-bit量化、TeaCache步跳过、CUDA Graphs和torch.compile,将FLUX.2推理延迟较H200降低6.3x(单卡)至10.2x(双卡),内存需求降40%。该技术栈深度绑定TensorRT-LLM visualgen和Blackwell硬件。
思科第二届AI峰会聚焦AI经济构建者,汇集NVIDIA、OpenAI、AWS、Google等基础设施与模型层领袖
思科宣布将于2026年2月3日举办第二届AI峰会,由CEO Chuck Robbins和首席产品官Jeetu Patel主持。峰会嘉宾阵容汇集了AI基础设施(NVIDIA、AWS、Google)、核心模型(OpenAI、Anthropic)、应用(Figma、Box)及资本(Andreessen Horowitz)等领域的决策者。议程覆盖从重塑计算、风险投资和基础设施到重新定义设计、劳动力及地缘政治的完整AI影响谱系。
OpenAI投资Merge Labs布局脑机接口
OpenAI宣布投资Merge Labs,支持开发连接生物与人工智能的脑机接口技术,旨在增强人类能力与体验。该动作显示OpenAI正探索AI与生物智能融合的新方向。
OpenAI 与 Cerebras 合作提升 AI 推理基础设施
OpenAI 宣布与 Cerebras 合作,新增 750MW 高速 AI 计算能力,旨在降低推理延迟并优化 ChatGPT 实时 AI 工作负载性能。这一合作凸显 OpenAI 持续投资专用 AI 硬件以支撑其大规模模型服务的战略方向。
趋势科技揭示Docker Desktop WSL2新型虚拟机逃逸攻击面
趋势科技发现Docker Desktop在WSL2环境下的新型虚拟机逃逸技术,攻击者可利用暴露的内部API与配置机制,从容器环境突破至宿主机执行任意代码。这暴露了开发工具链中隐藏的严重安全边界风险。
思科以AI就绪数据中心与园区网络架构,成为麦迪逊广场花园官方技术合作伙伴
思科与麦迪逊广场花园娱乐公司达成多年合作伙伴关系,思科成为其官方合作伙伴。思科为其提供由Catalyst交换机与无线硬件、Catalyst Center网络管理平台、Identity Services Engine(ISE)以及Nexus 9000系列数据中心交换机构成的网络基础设施,旨在构建灵活、可扩展且支持未来技术的网络基础。
NVIDIA发布交互式AI Agent:用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学
NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent,通过自然语言接口编排数据科学工作流,实现从数据加载到模型训练的端到端GPU加速,性能提升3-43倍。
Apple 通过开发者故事与教程,持续强化其端侧AI与空间计算开发生态
Apple 发布 Swift Student Challenge 获奖者故事,展示开发者如何利用 SwiftUI、Core ML(设备端机器学习框架)和空间计算技术构建应用。同时,Apple 宣布为 2026 年挑战赛提供新的开发教程,重点涵盖 SwiftUI、空间计算和机器学习。这体现了 Apple 对设备端 AI、沉浸式体验及开发者工具链的持续投入。
NVIDIA发布教程将轻量级LLM转化为终端AI代理
NVIDIA通过开发者博客发布教程,指导用户利用其开源的Nemotron Nano v2模型,在约200行Python代码内构建一个能理解自然语言并执行Bash命令的AI代理。该教程强调从零构建和利用LangGraph简化,核心在于实现安全的工具调用(Tool Calling)和人机回圈(Human-in-the-Loop)控制。
NVIDIA与SK hynix联合定义下一代AI内存,锁定HBM4与Vera Rubin架构协同
NVIDIA与SK hynix宣布多年技术合作,联合开发面向Vera Rubin、RTX Spark及Jetson Thor的下一代内存。同时,SK Telecom采用DGX全栈平台建设吉瓦级AI云,计划2027年上线。此举将SK hynix从供应商升级为联合架构定义者,强化NVIDIA在HBM及AI生态的锁定效应。
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA Technologies and GPU Architectures | NVIDIA
NVIDIA Home NVIDIA Home ...