Filter

×
当前筛选 清除全部
关键词: Token ×
89 情报总数
1/5 当前页
Microsoft Other 强信号 2026-06-01

微软与英伟达联合推出RTX Spark,将企业级AI算力引入轻薄PC

微软CEO Satya Nadella宣布,将在Windows生态中深度集成NVIDIA RTX Spark架构,旨在为轻薄型PC设备提供本地化、高性能的AI算力(达到petaflop级)和统一内存支持,推动AI工作负载从云端向终端设备迁移。此举标志着个人计算向“AI原生”设备演进的关键一步。

NVIDIA Other 强信号 2026-06-01

NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性

NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。

Intel Other 强信号 2026-06-01

英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位

英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。

Google Other 强信号 2026-05-29

Google推出A2UI开放协议,定义AI Agent原生交互式UI新标准

Google发布A2UI开放协议,允许AI Agent通过JSON描述交互式UI组件,并深度集成至Gemini Enterprise平台。开发者构建的A2A端点Agent可原生渲染日期选择器、地图等丰富控件,无需关心前端框架,由GE或自定义客户端负责安全渲染。

NVIDIA Other 强信号 2026-05-29

NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈

NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。

Anthropic Other 强信号 2026-05-28

Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式

Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。

Cloudflare Other 强信号 2026-05-28

Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环

Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。

Anthropic Other 强信号 2026-05-27

Anthropic发布《Zero Trust for AI Agents》安全框架

Anthropic于2026年5月27日发布《Zero Trust for AI Agents》白皮书,系统定义了企业AI Agent部署的安全框架。白皮书提出三条核心原则:永远不信任始终验证、假设已被攻破、最小权限。识别五大Agent特有威胁:提示注入(间接注入通过外部数据源,Microsoft Research确认LLM无法可靠区分信息性上下文和可执行指令)、工具投毒(首个野外恶意MCP服务器已发现)、身份/权限滥用(困惑代理人问题+记忆缓存凭证跨会话提权)、记忆/上下文投毒、供应链攻击。定义六大安全能力域的三级路线图(Foundation/Enterprise/Advanced),其中密码学身份+短命Token被列为Foundation底线——静态API Key即使带轮换策略也视为已被攻破。提出'设计测试':摩擦型措施(速率限制/跳板/短信MFA)对AI攻击者无效,必须优先移除能力而非限流能力。Agentic SOAR为防御运营新范式,几秒内应对AI驱动攻击。

Microsoft Other 强信号 2026-05-23

微软发布Fara1.5浏览器Agent模型,72%任务成功率超OpenAI/Google

...

Google Product Launch 强信号 2026-05-22

Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布

Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。

NVIDIA Other 强信号 2026-05-22

NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进

NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。

NVIDIA Other 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

Cisco Other 中信号 2026-05-21

思科Talos IR分享AI生成报告一致性控制方法

思科Talos事件响应团队发布研究,识别AI生成技术报告中的四类不一致问题,并通过提示工程方法进行控制。该研究基于桌面演练报告案例,旨在提升AI辅助内容生成的可靠性与效率。

AMD Other 强信号 2026-05-20

AMD定义“智能代理计算机”新品类,推动AI推理本地化

AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。

AMD Other 强信号 2026-05-20

AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算

AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。

NVIDIA Other 强信号 2026-05-20

英伟达强调AI智能体评估,推动生产系统标准

英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。

NVIDIA Other 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

Google Other 强信号 2026-05-19

Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力

Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。

Google Other 强信号 2026-05-19

谷歌发布Gemini 3.5系列,定义以代理为中心的AI基础设施新范式

谷歌推出Gemini 3.5系列模型,首款发布3.5 Flash,其核心是作为‘代理优先’的智能体引擎,与Antigravity平台结合,旨在处理企业级长周期、多步骤工作流,标志着AI从辅助工具向可执行复杂任务的生产力系统转变。

Microsoft Other 强信号 2026-05-18

微软开源Conductor:零Token成本的确定性AI Agent编排

微软在开源峰会上发布Conductor,一个用于多智能体AI工作流的开源编排工具。其核心在于通过YAML定义工作流,实现确定性的智能体间路由,并使用Jinja2模板处理条件分支,整个编排层不消耗任何LLM Token。