情报
AI 生成的结构化厂商动态简报
OpenAI
其他
中信号
2025-04-10
OpenAI发布BrowseComp,为浏览智能体建立基准
OpenAI发布了一个名为BrowseComp的新基准,旨在评估AI智能体在真实网络浏览任务中的性能。该基准侧重于衡量智能体完成复杂、多步骤网络任务的能力,而非单一技能。此举标志着OpenAI正从单纯提供模型,转向构建评估智能体实际应用能力的工具链。
OpenAI
其他
中信号
2025-04-09
OpenAI 推出 Pioneers 计划,聚焦特定领域模型评估与性能优化
OpenAI 推出 Pioneers 计划,旨在与特定行业(如金融、法律)的企业合作,共同评估和改进其模型在垂直应用场景下的性能。该计划通过早期访问、定制化评估和直接反馈渠道,帮助厂商优化模型在复杂、真实世界任务中的表现。此举标志着 OpenAI 从通用模型能力展示,转向深入特定应用领域进行系统性优化和验证。
OpenAI
其他
中信号
2025-04-07
OpenAI 发布欧盟经济蓝图,推动欧洲本地化AI发展
OpenAI发布了一份针对欧盟的经济发展蓝图,旨在推动AI在欧洲的开发与部署。该文件提出一系列政策建议,以帮助欧洲抓住AI机遇并促进区域经济增长。其核心主张是AI应‘由欧洲、在欧洲、为欧洲’发展。
OpenAI
其他
2025-04-02
OpenAI 设立非营利委员会以指导其发展
OpenAI 宣布成立一个非营利委员会,旨在为其作为非营利组织的长期发展提供战略指导。此举旨在结合其财务资源与技术能力,以构建其自称的“世界最佳非营利组织”。
OpenAI
其他
中信号
2025-04-02
OpenAI发布PaperBench,评估AI智能体复现研究能力
OpenAI推出了名为PaperBench的新基准测试,旨在评估AI智能体复现前沿人工智能研究论文的能力。该基准测试聚焦于智能体在真实、复杂研究任务中的表现,而非通用问答。此举标志着对AI智能体在专业、创造性工作流中实用性的评估进入更具体、更严谨的新阶段。