情报
AI 生成的结构化厂商动态简报
微软AI智能体多任务规划与推理框架突破
微软研究院提升AI智能体多任务处理能力,通过改进规划算法实现动态任务分解与优先级管理。该技术使智能体具备上下文切换和自适应调整能力,支持复杂自动化工作流。
谷歌发布世界模型研究原型Project Genie
谷歌推出基于世界模型技术的Project Genie研究原型,能够端到端模拟环境动态和物理交互。该技术专注于从静态生成转向动态环境模拟,为AI智能体训练、教育科技和内容创作提供新路径。
思科报告警示智能体AI基础设施差距
思科与Omdia联合报告指出80%高管认为智能体AI是企业生存关键,但当前基础设施存在显著差距。报告强调网络支持和安全运行需求,87%企业已调整战略优先级支持智能体AI部署。
OpenAI组建前沿联盟推动企业AI规模化部署
OpenAI宣布成立前沿联盟伙伴计划,旨在通过合作伙伴生态为企业提供安全可扩展的AI智能体部署解决方案。该计划专注于复杂AI工作流的生产环境部署,标志着OpenAI从开发者工具向企业级核心解决方案的战略演进。
三星通过Perplexity集成扩展Galaxy AI多智能体生态系统
三星宣布在Galaxy设备中深度集成Perplexity作为新AI智能体,通过系统级协调架构实现多应用无缝协作。该方案采用语音唤醒和框架级连接,减少用户手动切换,提升多步骤工作流效率。
OpenAI与Snowflake达成2亿美元合作将AI模型引入数据平台
OpenAI与Snowflake达成2亿美元合作协议,将在Snowflake数据平台中直接集成前沿AI模型能力,支持企业数据环境中的AI代理和洞察生成。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。
OpenAI发布BrowseComp,为浏览智能体建立基准
OpenAI发布了一个名为BrowseComp的新基准,旨在评估AI智能体在真实网络浏览任务中的性能。该基准侧重于衡量智能体完成复杂、多步骤网络任务的能力,而非单一技能。此举标志着OpenAI正从单纯提供模型,转向构建评估智能体实际应用能力的工具链。
OpenAI发布PaperBench,评估AI智能体复现研究能力
OpenAI推出了名为PaperBench的新基准测试,旨在评估AI智能体复现前沿人工智能研究论文的能力。该基准测试聚焦于智能体在真实、复杂研究任务中的表现,而非通用问答。此举标志着对AI智能体在专业、创造性工作流中实用性的评估进入更具体、更严谨的新阶段。