MiniMax闫俊杰:越发理解「科学技术是第一生产力」的含义
MiniMax的大模型日处理交互量排名国内AI公司首位。
本文为IPO早知道原创
作者|Stone Jin
据IPO早知道消息,在8月31日举行的首个“MiniMax Link伙伴日”上,MiniMax创始人闫俊杰以“用技术突破回答‘每日与世界的30亿次交互’”为主题作了开场演讲。
同时,闫俊杰在本次伙伴日上分享了基于MOE(混合专家模型)+ Linear Attention(线性注意力)的新一代模型技术的应用,并展示了MiniMax最新音乐模型、视频模型的研发成果。
另据闫俊杰透露,MiniMax每日与全球用户进行超30亿次交互,处理超3万亿文本token、2000万张图片和7万小时语音,大模型日处理交互量排名国内AI公司首位
值得一提的是,在本次伙伴日上,闫俊杰多次强调,其越来越意识到了“科学技术是第一生产力”这句话的含义,这也是MiniMax坚持技术创新的最底层原因。对此,闫俊杰进一步解释称,MiniMax一直都觉得技术重要,只是从“觉得技术重要”到“100%认为技术重要”其实也需要一个过程。
“做技术是一件非常奢侈的事,这件事甚至只有创业的时候才会理解。”闫俊杰补充道,“首先,做技术可能会失败;其次,做技术的研发投入很大;第三,当实验真正成功的时候,就会去想之前的尝试是不是可以不做,有时候就会想要不要走点‘捷径’。但从我们的实践经验证明,一旦想要‘走捷径’就会被打脸,这个事也发生好多次了。MiniMax这两年多的时间也遭遇了好几个‘至暗时刻’,抛开所有表象东西,我才越来越深刻地意识到‘技术是一家科技公司最核心要素’这件事,这是我们多次‘至暗时刻’里最共性的一点。”
在闫俊杰看来,当真正突破一些技术后,能够非常显著地感受到用户或者客户的认可,这是一种强烈的正反馈。“大部分正反馈也会遇到一些‘噪声’,但经过思考和总结后就会发现,本质还是技术的进步。其实不管是正反馈还是负反馈,到最后会发现底层都是技术,我还是比较庆幸自己一直是一个做技术的人。”
回到产品层面。作为中国首个研发MoE大语言模型并成功上线的AI企业,MiniMax持续在模型算法上做创新,并最新推出基于MOE+ Linear Attention的新一代模型技术。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。
在与GPT-4o同一代模型能力对比上,新一代模型处理10万token时效率可提升2-3倍,并且随着长度越长,提升越明显。相比于通用Transformer架构,新架构的原生线性计算复杂度大幅减少了大模型的训练和推理成本。在128K的序列长度下,新架构成本减少90%以上。
闫俊杰指出,不管是做MOE还是Linear attention、乃至其他探索,MiniMax最本质的思考逻辑还是如何让同样的效果模型变得更快。“快就是好。在两个性能类似的模型中,训练和推理更快的那个,可以更有效地利用算力资源迭代更多的数据,从而能够有一个更好的模型能力。”
此外,MiniMax本次还推出了视频模型和音乐模型——视频模型具有压缩率高、文本响应好和风格多样等优点,可生成原生高分辨率、高帧率视频,模型能力首屈一指;而MiniMax第一款音乐模型则可以合成纯音乐为制作人快速构建歌曲的基本结构,由歌手自由演绎主唱或和声部分,且已实现对粤语、日语、韩语、西班牙语等多语种支持的升级。
目前, MiniMax音乐生成模型与视频生成模型已经在开放平台和海螺AI网页版上线。此外,abab 7系列多模态模型将于未来数周内正式发布,并采用新一代创新技术
据闫俊杰介绍,MiniMax当前的商业化主要分成两种形式:对于开放平台,MiniMax现已有2000多家客户,包括知名互联网公司、知名传统企业等;对于To C产品,MiniMax的产品里也有广告机制。闫俊杰表示,在目前的阶段,MiniMax最优先考虑的不是商业化,而是真正让技术到达广泛可用的程度。
对于星野等C端产品,闫俊杰进一步指出,MiniMax的底层设计是做一个内容社区。“打造AI内容社区这件事在全球范围内都是比较独特的,星野在AI内容社区这件事上也做得比较靠前。”
当然,“社区”也是所有互联网产品中最难做的一个。为此,要想自己的AI应用取得渗透率和和使用深度上质的提高,闫俊杰认为最重要的三个优化方向是:如何让模型的错误率持续降低;无限长的输入和输出;以及多模态。“这需要一步一步演化,不是一蹴而就的。”
当谈及与大厂的竞争时,闫俊杰坦言,MiniMax能做的事情就是尽可能将两点能力无限放大:其一是如何提升技术,其二则是如何跟用户更好的共创。“想要和大厂竞争,就需要快速看清一些非常底层的东西。这两点(技术提升与用户共创)都需要一些非常关键的判断,也都需要非常长期的积累。”
闫俊杰亦强调,竞争其实并不是一件“坏事”,中国的移动互联网、手机、新能源汽车等行业都在经历了长期激烈的竞争后、站在了全球领先的位置上。
“竞争是客观规律。大模型确实可以产生巨大的社会价值,也确实就应该有很多的竞争。”闫俊杰表示,“希望与各位携手努力,和MiniMax一起,把人类的智能边界再向外推动一点,真正实现Intelligence with Everyone。