OpenAI - AI基础设施情报搜索

OpenAI 其他中信号 2025-04-10

OpenAI发布BrowseComp，为浏览智能体建立基准

OpenAI发布了一个名为BrowseComp的新基准，旨在评估AI智能体在真实网络浏览任务中的性能。该基准侧重于衡量智能体完成复杂、多步骤网络任务的能力，而非单一技能。此举标志着OpenAI正从单纯提供模型，转向构建评估智能体实际应用能力的工具链。

OpenAI 其他中信号 2025-04-09

OpenAI 推出 Pioneers 计划，聚焦特定领域模型评估与性能优化

OpenAI 推出 Pioneers 计划，旨在与特定行业（如金融、法律）的企业合作，共同评估和改进其模型在垂直应用场景下的性能。该计划通过早期访问、定制化评估和直接反馈渠道，帮助厂商优化模型在复杂、真实世界任务中的表现。此举标志着 OpenAI 从通用模型能力展示，转向深入特定应用领域进行系统性优化和验证。

OpenAI 其他中信号 2025-04-07

OpenAI 发布欧盟经济蓝图，推动欧洲本地化AI发展

OpenAI发布了一份针对欧盟的经济发展蓝图，旨在推动AI在欧洲的开发与部署。该文件提出一系列政策建议，以帮助欧洲抓住AI机遇并促进区域经济增长。其核心主张是AI应‘由欧洲、在欧洲、为欧洲’发展。

OpenAI 其他 2025-04-02

OpenAI 设立非营利委员会以指导其发展

OpenAI 宣布成立一个非营利委员会，旨在为其作为非营利组织的长期发展提供战略指导。此举旨在结合其财务资源与技术能力，以构建其自称的“世界最佳非营利组织”。

OpenAI 其他中信号 2025-04-02

OpenAI发布PaperBench，评估AI智能体复现研究能力

OpenAI推出了名为PaperBench的新基准测试，旨在评估AI智能体复现前沿人工智能研究论文的能力。该基准测试聚焦于智能体在真实、复杂研究任务中的表现，而非通用问答。此举标志着对AI智能体在专业、创造性工作流中实用性的评估进入更具体、更严谨的新阶段。

情报

筛选

OpenAI发布BrowseComp，为浏览智能体建立基准

OpenAI 推出 Pioneers 计划，聚焦特定领域模型评估与性能优化

OpenAI 发布欧盟经济蓝图，推动欧洲本地化AI发展

OpenAI 设立非营利委员会以指导其发展

OpenAI发布PaperBench，评估AI智能体复现研究能力