豆包们穷追不舍,Kimi要靠「深入推理」抵御AI巨头冲击
大概一个月前,OpenAI 推出了 o1 模型,不仅展示了强大的语言生成能力,还通过引入强化学习,实现了更高层次的推理和自我纠错能力。
9 月 16 日,月之暗面(旗下 Kimi)创始人杨植麟在天津大学宣怀学院做了一场分享,其中特别提到了 OpenAI 发布的 o1 模型,标志着通用智能(AGI)范式的变化,而下一个范式,「是通过强化学习来做的。」
或许在当时,或许更早,月之暗面就已经投入到了强化学习的新范式之中。
但不管如何,根据「大厂青年」公众号最新爆料,月之暗面有团队,在国庆期间「一直疯狂赶进度」,主要就是为了即将上线一个「很牛的功能」。
爆料进一步指出,该功能与模型的深度推理有关,预计将于下一个版本上线,会在搜索入口下方增加一个「深入推理」的功能开关,可以回答简单搜索无法解决的问题,甚至可以自我反思。
这是 Kimi 的 o1?
接力 OpenAI o1,通用智能新范式的一次转移
在 OpenAI o1 之前,AI 大模型的表现通常局限于「快速应答」,也就是通过预测下一个词来生成答案。这种方式效率高,但其思维模式单一,缺少对复杂问题的深入推理和自我反思能力。
图/ OpenAI
但随着 OpenAI 推出的 o1 模型,这种局限性开始被突破。o1 的核心变化在于引入了强化学习机制,模型在面对问题做出响应之前,会花上更多时间思考问题,来进行深度推理和自我纠错。
这就类似大脑的慢思考——一种被称为「系统 2」的能力,o1 有了学习并完善思维过程的能力,可以尝试不同的策略,并认识到自己的错误。这种能力的提升对于 AI 的智能化带来了显著的影响。传统模型通常只会对用户输入做简单的直线型回答,而没有「思考」过程的多样性和深度。
例如,在处理复杂的数学题或法律案例时,模型只是依靠大量数据的模式匹配进行预测。o1 通过强化学习,让 AI 可以进行多步骤推理,类似于人类解决问题时的思维路径——先提出假设,逐步验证推理,并且在过程中不断自我修正错误。
通过这种慢思考模式,AI 不仅能给出更准确的答案,还能在面对不确定性时进行自我反思,在一定程度上避免过去模型常见的「幻觉」。
杨植麟同样也在天津大学的演讲中指出,AI 只有通过学习人类的思考过程,才能得到更好的泛化能力,而且能通过这个过程又产生了更多天然不存在的数据,应对更多未知的问题。
图/上海创新新创业青年 50 人论坛
这对于最终用户体验的影响也是巨大的。对于普通用户而言,推理能力的增强意味着在与 AI 互动时,能够获得更具深度、逻辑性更强的回答。
在 ChatGPT 中使用 o1-preview 模型就能明显感受到,很多时候不再需要将问题简单分解成多个小问题逐步提问,而是可以直接提出复杂的问题,AI 可以通过多步骤推理,给出综合性的解决方案。
更重要的是,自我反思的引入让 AI 可以像人类一样在过程中发现自身的错误。
这种自我反思能力不仅能够大幅减少错误率,还提升了用户对 AI 的信任感。AI 不再是一个机械的应答者,而更像是一个具备「思考」能力的智能助手,可以理解上下文、深刻分析问题,甚至在发现自身错误时及时调整,从而为用户提供更高质量的答案。
所以不难理解,为什么 Kimi 要做「深入推理」。事实上,国内大模型也在向这一趋势靠拢,在 9 月底举办的阿里云栖大会上,一部分大模型公司和研究机构就达成了一定的共识,即 OpenAI 推出的 o1-preview 代表了通用智能新的进化方式的开端。
通用智能圆桌对话,图/云栖大会
但趋势归趋势,Kimi 对于「深入推理」功能的迫切,还在于国内市场面临的竞争态势在发生变化。
假期赶进度,豆包给到Kimi的压力越来越大
不管新功能是什么,不难看出,顶着国庆假期赶进度,在一定程度上说明了 Kimi 团队的的急迫感。而这些压力,主要还是来自于国内其他大模型公司的激烈竞争。
经常看 B 站的朋友应该都会发现,之前一直出现在站内广告中的 Kimi,存在感已经相当薄弱,取而代之则是满屏的「豆包」。而字节跳动的豆包,也无疑是目前国内 AI 智能助手的领头羊。
公开数据显示,5 月上线以来,豆包连续数月一直占据 App Store 免费榜的前列位置,6 月更是长达一个月霸占榜首。即便到 10 月,豆包也仍排在第四。优秀的产品体验以及海量的推广,豆包可以说在短时间内迅速吸引了海量用户,也占领了市场。
图/苹果
a16z 公布的全球 AI 产品前 100 榜单中,豆包同时出现在网页端和移动端的前 50 名榜单中,显示了其在全球市场的影响力。而与之对比,Kimi 在此榜单中未见踪影。
不只是豆包。同为大模型初创公司的 MiniMax 也在迎来爆发。从 9 月以来,旗下 AI 智能助手——海螺 AI 的数据出现爆发式增长,月访问量翻了超过 8 倍,月活用户接近 500 万。
另一方面,Kimi 过去最为人熟知的优势就是长文本的处理能力,能够支持大量资料的快速处理。但随着技术的迭代,各家大模型的上下文处理能力都发生了很大的进步,谷歌 Gemini、阿里通义、腾讯元宝以及月之暗面 Kimi,都支持了 1000 万 Token/字的长上下文。
而在此之后,Kimi 最明显的「优势」不再明显,同时各家的竞争也开始多元,甚至更侧重于产品功能层面。在这个阶段中,Kimi 并没有让用户感知到其他更明显的优势,也就很难守住 AI 智能助手「当红炸子鸡」的市场地位。
在这种背景下,Kimi 面临的挑战是显而易见的。
抗击巨头冲击波,Kimi 需要「深入推理」
Kimi 正在开发的「深入推理」功能,无疑是一剂强心剂。在激烈的竞争中推出「深入推理」功能,不仅有利于 Kimi 提供能够与领先者竞争的差异化功能和能力,在竞争激烈的市场中重新站稳脚跟。
更重要的是,「深入推理」不仅意味着能够得到更复杂问题的答案,还代表着 AI 可以在长时间对话中进行深度思考和自我反思,将极大提升用户在使用 Kimi 过程中的体验,尤其是面对复杂任务的场景中。
这也符合 Kimi 一直以来的用户画像——学生、大学生、实习生、打工人,并且用户更聚焦在学习、办公协助上。相较之下,不管是豆包还是海螺 AI 其实都有更多角色扮演、情感交流的定位。
图/ Kimi
而且对于现在 AI 智能助手的用户来说,简单的答案生成已经不足以满足他们的需求。越来越多的用户期望 AI 不仅是简单地回答问题,而是能够帮助复杂的工作任务和日常的内容创作,甚至在推理过程中自我纠错。
伴随用户对 AI 要求的不断提高,Kimi「深入推理」或许能够帮助用户更好地应对他们面临的更多现实问题和更高难度的任务,创造更强的用户黏性。与此同时,「深入推理」对团队自身的提振作用可能也不容忽视。
总而言之,Kimi 的「深入推理」功能或许将是一次关键的升级,对于 Kimi 来说也是一剂强心剂,既是在激烈的市场竞争中重新找回属于自己的竞争优势,也是为通用智能的范式转变奠定基础。
或许再之后,「深入推理」将不只是一个功能,而是成为 Kimi 背后大模型的底层能力。而在国产大模型以及 AI 智能助手之中,目前来看,Kimi 很可能是最早迈出这一步的厂商。