OpenAI新模型亮相 推理能力升级

先前传得沸沸扬扬的「草莓计划」(Project Strawberry)为OpenAI内部使用代号,这次发布将模型命名为「o1-preview」和「o1-mini」,尽管和先前模型比起来,反应时间更长,但可以在科学、程式编码和数学方面,以推理能力解决更加复杂困难的任务和问题。

OpenAI训练这些模型结合推理技巧,将复杂的问题拆解为更小的逻辑和步骤,模仿人类思维,在反应前花更多时间思考,并在过程中学会改进自我的思考过程,尝试不同的策略,认知自身犯下的错,使用者毋须下进一步的指令就能得到更好的答案。

据官方介绍,这款模型可以提高在竞争性程式设计问题的表现,并在科学问题基础上超越人类「博士等级」的准确程度。o1系列模型在国际数学奥林匹亚竞赛中的正确率为83%,狠甩前一代模型GPT-4o的13%。

o1系列模型代表AI领域的一大步,但它虽在部分项目更加优秀,但应用上面却比GPT-4o更昂贵且耗时。OpenAI将o1模型命名为「o1-preview」(预览版),代表它仍处于初期阶段。

对开发人员来说,存取o1的成本极高,价格为GPT-4o的3至4倍。在应用程式开发介面(API)中,o1-preview每百万个输入符元(token)或模型解析的文字区块收费为15美元,每百万个输出符元的费用为60美元。相较之下,GPT-4o每百万个输入符元的成本仅5美元,每百万个输出符元为15美元。