曝OpenAI神秘大模型“草莓”两周内发布!

智东西作者 香草编辑 李水青

智东西9月11日消息,据外媒The Information昨晚报道,OpenAI的新模型“草莓”(Strawberry),将在未来两周内作为ChatGPT服务的一部分发布。

“草莓”项目是OpenAI盛传已久的神秘Q*模型,据传是此前OpenAI政变大戏的关键原因之一。它展现出了解答数学问题、复杂编程的强大能力,让AI安全的研究人员都为之震惊。

上个月初,OpenAI CEO Sam Altman曾在推特暗戳戳秀自家花园5颗草莓。当时有网友根据草莓成熟时间预测,“草莓”模型或者GPT-5,可能在未来4-6周内发布。这次曝出的时间点,正好和当初网友的预测对上了。

▲Sam Altman秀草莓

两位参与模型测试的人员透露了更多该模型的细节。“草莓”与其他对话式AI最大的区别,在于它会在回答之前进行“思考”,这一阶段通常持续10~20秒。

此外,“草莓”的初代版本只能接收和生成文本,不能处理图像等其他多模态信息,这似乎与如今市面上的主流大模型发展方向有些不同。

一、“三思而后答”,初代为纯文本模型

据测试人员透露,“草莓”虽然是ChatGPT的一部分,但它将是一项独立产品。其具体的服务方式尚不清楚,一种可能是作为可选择的模型,在ChatGPT的下拉菜单中提供。

“草莓”最大的特点,就是会在回答前进行“思考”,而非立即给出响应。这一阶段通常持续10~20秒。

思考阶段有助于模型避免出错,这段额外的时间也使“草莓”更有可能知道何时需要向用户提出后续问题,以便提供更全面的解答。这既可以视作深思熟虑的优点,但同时也可以视作反应迟钝的缺点。

此外,“草莓”的初代版本只能接收和生成文本,不能处理图像等其他模态信息。而如今市面上大多数大模型都是多模态的,纯文本似乎是一个明显的弱点,这可能反映了OpenAI在发布产品上面临的压力。

二、或将以速率限制收费,无需“思维链提示

价格方面,“草莓”的定价可能与OpenAI的聊天机器人不同,后者有免费和订阅两种级别。据另一位了解该产品的人士称,它可能会有速率限制,限制用户每小时发送的最大消息数量,并且可能会有响应速度更快的高价级别。

与OpenAI目前最强的模型GPT-4o相比,“草莓”可能更擅长处理复杂、多步骤的问题。目前,用户在使用ChatGPT时往往需要输入各种额外的提示词,才能得到理想的答案,也就是所谓的“思维链提示”,例如告诉聊天机器人逐步展示其推理过程。“草莓”的功能旨在避免这些步骤。

这意味着,“草莓”不仅在数学问题和编程方面会表现更佳,而且在更“主观”的商业任务上也会表现更好,比如头脑风暴制定产品营销策略等。在这类任务中,该模型将提供更符合用户公司特定情况且更详细的建议。

三、思考模式存在弊端,记忆能力仍有待提升

但在模型发布之前或之后,OpenAI可能还有一些问题需要解决。

例如,尽管从理论上讲,当“草莓”被问到简单问题时,能够跳过思考步骤直接回答,但一位测试人员说,在实际操作中模型并不总是这样做。它可能会错误地花费太长时间,来回答那些其他模型可以立即回答的问题。

一些使用过“草莓”原型的人抱怨,与GPT-4o相比,它虽然响应略好一些,但并不值得额外等待10~20秒。

此外,虽然“草莓”旨在在回答新问题之前,记住并整合前面的聊天记录,用以满足用户的特定偏好,但模型在这方面有时也存在问题。

结语:OpenAI凭借“草莓”重振旗鼓?

不可否认,OpenAI在很长一段时间内都是大模型产品领域的领头羊,但它面临的竞争日益激烈。

例如在上个月,谷歌对标GPT-4o的AI语音助手Gemini Live已经广泛落地,其能够灵活处理用户的打断和突然的话题变化。OpenAI在5月首次发布了AI语音助手GPT-4o Voice,但随后为了改进安全措施而推迟了发布。

“草莓”能否帮助OpenAI恢复势头,我们拭目以待。