☰

OpenAI再推新模型！国际数学奥林匹克资格考答对率83％

图文／镜周刊

OpenAI表示，该公司开发了一系列新的AI模型OpenAI o1，即日起提供使用。这些模型能够通过复杂的任务并解决比以往更难的问题，包括科学、程式和数学领域。

OpenAI在ChatGPT和API中推出了这个系列的第一个模型，该模型是预览版本，OpenAI期望会有定期的更新和改进。OpenAI表示，他们训练这些模型在回应之前花更多时间思考问题，类似于人类的思维过程。通过训练，它们学会了精炼自己的思考过程，尝试不同的策略并识别自己的错误。

在测试中，新登场的模型更新将在物理学、化学和生物学的任务中表现类似于博士生。我们还发现它在数学和编写程式方面表现优异。在国际数学奥林匹克（IMO）的资格考试中，GPT-4o仅正确解决了13％的问题，而新的推理模型则达到了83％。它的城市能力在比赛中被评估达到Codeforces竞赛的第89百分位。

作为一个早期模型，OpenAI o1-preview尚未具备ChatGPT所拥有的许多有用功能，例如网页浏览和文件、图像上传。在许多常见情况下，GPT-4o在短期内会表现更优异。但对于复杂的推理任务，新模型展现全新高水准，表现出显著进步，因此OpenAI将这个系列命名为OpenAI o1。

OpenAI表示，为了匹配这些模型的新能力，该公司加强了安全工作、内部治理和联邦政府合作。这包括使用我们的准备框架进行严格的测试和评估，并由安全性委员会进行董事会级的审查过程。

OpenAI强调，该模型增强的推理能力对于处理科学、程式、数学等类似领域的复杂问题可能特别有用。例如，o1可以被医疗保健研究人员用来注释细胞测序数据，物理学家用来生成量子光学所需的复杂数学公式，以及各领域的开发人员用来构建和执行多步骤工作流程。

更多镜周刊报导【美总统辩论】泰勒丝表态挺贺锦丽！批川普AI造假　「抱猫照」酸爆范斯时代杂志公布「AI百大影响力人物」　魏哲家、黄仁勋、苏姿丰上榜工研院新科院士出炉！　AI大咖辉达黄仁勋、超微苏姿丰皆上榜

相关资讯