☰

对话月之暗面杨植麟：竞争是做正确的事当下最关心“留存”

出品｜本站科技《态度AGI》栏目

作者｜丁广胜

一个小时之前，月之暗面创始人杨植麟在北京与本站科技等媒体见面，内容无他，只和最新模型有关，针对“登月计划”的关键一步kimi数学模型k0-math。

这是月之暗面对于大模型下一步发展的思考，即让大模型思考。

杨植麟说月之暗面接下来探索的关键有两个，一个是强化学习，一个是数学场景。

大约400年前，伽利略著名的论断说，宇宙是一本用数学语言写成的“宏伟之作”。

杨植麟引用伽利略的这句话，阐述了月之暗面对于数学场景布局的判断。

基准测试显示，Kimi k0-math 的数学能力可对标全球领先的 OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。

在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math 初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的90% 和83%。

杨植麟表示，Kimi 探索版也通过运用强化学习技术创新了搜索体验，在意图增强、信源分析和链式思考三大推理能力上实现突破。

“k0-math 模型和更强大的 Kimi 探索版，未来几周将会分批陆续上线 Kimi 网页版和Kimi智能助手APP，帮助大家解决更有挑战的数学和搜索调研类任务。”

以下为杨植麟对话媒体现场实况记录（AI转录，经人类精选、删减）：

问：为什么时候决定聚焦kimi的？

杨植麟：今年三四月份。我们主动选择做业务上的减法，聚焦把最重要的事情做好，始终保持大模型公司里人最少的，卡和人的比例最高的。

把一个产品做好，做到极致，是最重要的，我们不希望人数涨的特别猛，我们不能活生生把自己变成大厂。

问：现在都在谈应用，但超级应用迟迟没有出现，为什么？

杨植麟：已经出现了，ChatGPT有5亿月活，这就是超级应用。我们会根据美国市场的情况，来调整自己，选择一条河AGI愿景更贴合的路。

问：你如何看待大模型预训练？

杨植麟：预训练还有半代到一代模型的空间，这个空间明年就会释放出来，也就是说，明年基本上领先的模型会把预训练做到比较一致的阶段。

但我们判断，强化学习是一个重点。只是用不同的方式去做。我对Scaling Law还是乐观的。

问：你们为什么不做多模态？

杨植麟：已经在内测了。AI思考和交互，我们看重这两个能力，思考是决定上限，交互是必要条件。

问：你们和豆包竞争比较激烈，同一赛道，接下来如何应对？

杨植麟：竞争本身并不产生价值，我们做好模型思考推理能力，给用户带来价值，做正确的事情，而不是专门做不一样的事情。

问：kimi最核心的任务是什么？

杨植麟：提升留存。这是当前最重要的事情，还有非常大提升的空间。我们离AGI的距离还处于初级阶段

问：如何解决模型过渡思考的问题？

杨植麟：因为我们现在没有对他的长度做任何的限制，所以他想想多少就想多少，我就让他自由的思考。问题出现在奖励上。

问：如果解决数据问题，让数据实现更大价值？

杨植麟：对强化学习来讲是核心的问题，数据是自己生成，奖励模型的效果会有更大的挑战，核心是训练更好的模型。

问：行业发展到今天，还有不少难题待解决，比如算法算力数据的平衡问题？

杨植麟：AI的发展是一个荡秋千的过程，两种状态之间来回切换，算力不够需要好算法，那没有高质量的数据也会成为问题，那就是让算法改变让这个事情不成为瓶颈。有时候加再多的卡业不可能提升效果。

问：你如何看待大模型的成本问题，有好的解决办法了吗？

杨植麟：接下来的版本会让大家去做选择。早期会用之前的方案来给用户好的体验，接下来会动态分配算力，模型足够聪明的话知道自己需要想多久、思考时间更短。另外算力成本的下降也是一个关键因素。

问：如何看待AI人才回流大厂？

杨植麟：月之暗面没有遇到这样的问题。这是正常的，行业发展进入新的阶段，之前做这个事的公司很多，现在做的公司少了，这是行业发展的规律。

问：这次发布数学模型，是不是数学和普通人比较远？

杨植麟：教育产品价值很大。在我们现有流量里面也可以看到这一点。

问：什么时候出海？

杨植麟：先聚焦再全球化，我们有耐心。

对话月之暗面杨植麟：竞争是做正确的事 当下最关心“留存”

相关资讯

对话月之暗面杨植麟：竞争是做正确的事当下最关心“留存”