OpenAI:我們將發佈一項新的評估FrontierScience,用於衡量專家級的科學推理能力。FrontierScience包含兩個題型:奧林匹克賽題,用於評估奧林匹克競賽式的科學推理能力;研究賽題,用於評估現實世界中的科研能力。

2025-12-17

OpenAI:我們將發佈一項新的評估FrontierScience,用於衡量專家級的科學推理能力。FrontierScience包含兩個題型:奧林匹克賽題,用於評估奧林匹克競賽式的科學推理能力;研究賽題,用於評估現實世界中的科研能力。