OpenAI再推新模型!国际数学奥林匹克资格考答对率83%

图文/镜周刊

OpenAI表示,该公司开发了一系列新的AI模型OpenAI o1,即日起提供使用。这些模型能够通过复杂的任务并解决比以往更难的问题,包括科学、程式和数学领域。

OpenAI在ChatGPT和API中推出了这个系列的第一个模型,该模型是预览版本,OpenAI期望会有定期的更新和改进。OpenAI表示,他们训练这些模型在回应之前花更多时间思考问题,类似于人类的思维过程。通过训练,它们学会了精炼自己的思考过程,尝试不同的策略并识别自己的错误。

在测试中,新登场的模型更新将在物理学、化学和生物学的任务中表现类似于博士生。我们还发现它在数学和编写程式方面表现优异。在国际数学奥林匹克(IMO)的资格考试中,GPT-4o仅正确解决了13%的问题,而新的推理模型则达到了83%。它的城市能力在比赛中被评估达到Codeforces竞赛的第89百分位。

作为一个早期模型,OpenAI o1-preview尚未具备ChatGPT所拥有的许多有用功能,例如网页浏览和文件、图像上传。在许多常见情况下,GPT-4o在短期内会表现更优异。但对于复杂的推理任务,新模型展现全新高水准,表现出显著进步,因此OpenAI将这个系列命名为OpenAI o1。

OpenAI表示,为了匹配这些模型的新能力,该公司加强了安全工作、内部治理和联邦政府合作。这包括使用我们的准备框架进行严格的测试和评估,并由安全性委员会进行董事会级的审查过程。

OpenAI强调,该模型增强的推理能力对于处理科学、程式、数学等类似领域的复杂问题可能特别有用。例如,o1可以被医疗保健研究人员用来注释细胞测序数据,物理学家用来生成量子光学所需的复杂数学公式,以及各领域的开发人员用来构建和执行多步骤工作流程。

更多镜周刊报导【美总统辩论】泰勒丝表态挺贺锦丽!批川普AI造假 「抱猫照」酸爆范斯时代杂志公布「AI百大影响力人物」 魏哲家、黄仁勋、苏姿丰上榜工研院新科院士出炉! AI大咖辉达黄仁勋、超微苏姿丰皆上榜