藉由推論、以不同方式解決問題 OpenAI推出能花費更多時間「思考」的自然語言模型「o1」

苹果新品来了

OpenAI稍早公布其名为「o1」的自然语言模型,标榜能以较多时间进行"思考",借由推论、以不同方式解决问题,并且能从错误中修正,借此增加解答准确率。

自然语言模型预期就是先前传闻代号「Strawberry」的产品,强调如真人般思考,同时也会从经验中学习。

跟其他自然语言模型一样,OpenAI在推出「o1」预览版本之余,同时也提供对应轻量化运算需求、反应速度更快的「o1-mini」。前者目前仅开放OpenAI服务付费用户测试,同时现阶段也有严格的30组讯息使用量限制,而后者则同样仅限付费用户使用,并且限制50组讯息使用量。

跟先前推出的GPT系列模型不同,「o1」采用不同命名方式,似乎意味将采用不同产品发展策略,同时「o1」本身不具备网路浏览功能,同时也无法由使用者上传文件或图像,基本上就是透过模型训练基础,以及持续与人互动学习结果进行成长。

而「o1」在运算过程会考量问题本质,以及解答内容的正确性,因此在物理、化学、生物学,以及包含数学、程式编码表现更为突出,但相对在运算执行速度会花费更多时间进行验证,与GPT系列模型主要透过资料比对归纳结论的方式不同,「o1」会更着重在解答内容是否正确、与提问内容逻辑是否相符等。

以解答国际数学奥林匹克竞赛测验内容中,OpenAI表示GPT-4o的解答正确率仅有13%,但「o1」的正确率则提升至83%。

不过,虽然花费更多时间检查、验证,让实际得出解答正确率更高,并不代表「o1」不会像GPT系列模型有"睁着眼睛说瞎话"情况,实际解答内容可能还是需要由人类作最终确认。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》