Reports
AI-generated structured vendor updates
OpenAI发布BrowseComp,为浏览智能体建立基准
OpenAI发布了一个名为BrowseComp的新基准,旨在评估AI智能体在真实网络浏览任务中的性能。该基准侧重于衡量智能体完成复杂、多步骤网络任务的能力,而非单一技能。此举标志着OpenAI正从单纯提供模型,转向构建评估智能体实际应用能力的工具链。
OpenAI发布PaperBench,评估AI智能体复现研究能力
OpenAI推出了名为PaperBench的新基准测试,旨在评估AI智能体复现前沿人工智能研究论文的能力。该基准测试聚焦于智能体在真实、复杂研究任务中的表现,而非通用问答。此举标志着对AI智能体在专业、创造性工作流中实用性的评估进入更具体、更严谨的新阶段。
微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力
微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。
高通与Snap深化合作,押注XR设备作为AI智能计算新终端
高通与Snap子公司Specs Inc.签署多年期战略协议,将基于骁龙XR平台为未来的Specs智能眼镜提供算力支持。该合作旨在构建一个可扩展的基础平台,以支持开发者在眼镜上创建更智能、更私密的本地AI体验。此举标志着两家公司正将长期合作关系从消费级AR眼镜,向一个更强调设备端智能代理和沉浸式计算体验的平台演进。
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。
趋势科技揭示Azure DNS设计缺陷暴露云基础设施接管风险
趋势科技旗下TrendAI™研究团队披露了Azure云平台中一个“设计使然”的安全漏洞。已删除的Azure资源其DNS记录可能被持久保留,攻击者可利用这些残留的DNS名称,接管受信任的端点并入侵依赖系统,揭示了云基础设施中一个关键但常被忽视的信任继承风险。