对话李笛:大模型已退烧,卷参数没意义

提起人工智能,一定绕不开一家老牌AI公司——小冰。提到这轮大模型浪潮,更是绕不开一位经常发表“降温”言论的技术人——小冰公司CEO李笛。

因为同样和微软关联紧密,小冰公司经常被拿来和OpenAI比较。小冰团队从2013年开始做AI,2020年从微软分拆、成立独立公司,代表产品“小冰”是为数不多依然活跃的人工智能助手。OpenAI的大股东是微软,它的ChatGPT则划出了AI时代的分水岭。

两位掌舵人听起来截然不同的观点,更是添了几分博弈的色彩。重掌OpenAI大权的萨姆·奥特曼(Sam Altman)说,GPT-5会更令人惊叹。李笛则因为“大模型会退热”的言论,被贴上了看衰大模型的标签。

“就连我们自己的投资人都说,你是不是反对大模型?”李笛说,自己对大模型真的狂热不起来,“这一波技术创新去年5月就到此为止了,应该考虑怎么把新的技术能力落地,但行业还是在卷大模型,现在一堆大模型都‘烂尾’了”。

日前,小冰公司宣布已成功获得“小冰大模型”国内备案,小冰克隆人、歌手克隆人分支等一系列测试产品转为正式发布。这些都是小冰利用大模型的技术能力升级后的产品。

而小冰公司的商业模式没有变过,一直是“创造人(克隆人),买卖人”,一套人工智能技术框架支撑三种业务,to C的网红克隆人、歌手克隆人和to B的数字员工。

五年前,我们曾和李笛有过一次长谈,那时小冰还没脱离微软,李笛的角色是小冰的全球负责人,五年之后再见,小冰公司已经独立。我和李笛这次对话,他分享了小冰公司在这轮大模型浪潮中的“为”与“不为”。

李笛还聊了一些一度让他头疼的问题:诸如,卖API不挣钱,怎么让AI的价值被认可,把利润做上去;克隆人如何成为人的情感纽带,和人建立长期关系;克隆人在C2C模式下,怎么规避擦边和违规风险;小冰要引入外部投资,一个产品经理出身的CEO怎么和投资人“博弈”……

以下是对话核心内容:

01

2024年,很多人的大模型梦会破灭

问:你去年讲大模型会退烧,今年对行业的判断是怎样的?

李笛:这波浪潮有一个特别大的特点,准入门槛被降低了,给人一种幻觉,只要暴力地做就有办法做成,这就有很大的问题。

我的判断是,今年很多人的大模型梦会破灭。企业终于弄明白大模型不是那么帮得上我,也就不那么投入了;大模型公司也终于弄明白,再追求参数,也出不来东西;其他各行各业的,想靠发一个大模型,改变本领域的现有竞争格局,也会发现很难。

问:你的投资人会不会有不同看法?

李笛:去年我们说了我们的判断,就连我们自己的投资人都说,你是不是反对大模型?

我说一言难尽,当一个新的时代的人出现的时候,他总要找一些“假想敌”。别人总是和小冰做对比,我们其实受到了一定的影响,这决定我们要开始追求一些数字了。坦率地讲,我内心并不看重这些数字,但是需要去追求。

最近我跟投资人的交流比较多。投资人有的时候发消息说,你们也应该参加这个榜单。可我认为,基于榜单做优化太容易了,卷榜没意义。

但科技企业跟其他行业一个很大的区别是,科技行业特别担心发表保守言论,特别害怕被认为是保守的。

可我对大模型真的不狂热。我们也可以学别人说,“大模型是我们期待已久的时代”,过两个礼拜以后,光这么说都不管用了,你得说自己信仰大模型,再过两个月,你不五体投地一下都不行。但我们不太乐意这么做。

问:和其他大模型相比,小冰的路线有什么特别之处?

李笛:我们跟行业里尤其是国内做大模型的公司,有一个时间差,我们做得比较早一些。

当行业还在为ChatGPT惊呼的时候,认为一定要布局大模型,期待新一波的技术井喷、创新井喷的时候,我们做的更多的是怎么落地。

这种差异的原因,在于对接下来创新变数的判断。

我们经历过AI的几个周期,我们认为,创新不是持续的,而是到了一个阶段就会陷入瓶颈。这时候应该基于新的技术能力,去考虑落实,而不是再去追逐。

但当时,行业里尤其是国内行业里受很多综合因素影响,热情高涨。很多入局大模型的人,都是最近三年才开始做人工智能的。

大模型乱战,还会导致一些乱象。因为大模型的成本巨大,所以它跟以前互联网的“百团大战”有一个很大的区别,“百团大战”最后经过资本的整合,可以产生“1+1”的加成效应。我扫这条街,你扫那条街,我们都做一样的生意,最后一合并,咱们俩就有两条街。

但是大模型这种技术类产品,产生不了加成效应。我有一个大模型,你有一个大模型,咱们俩一合并,几乎等同于一个大模型,因为咱俩的大模型是差不太多的,谁跟谁都拉不开差距。

其实咱们国家不缺算力,缺的是合理的运用。我们的大模型上了日本好几个榜单的榜首,而且持续好几个月,参数都不大。我们更关注的是预训练数据,如何合理地利用好它的模型参数规模。

行业里现在已经是共识了,落地需要的是中模型、小模型,甚至很多人在考虑端上的模型,我们在去年3月份的时候就这么说。

所以回答你的问题,小冰一直在做的事情,是基于我们对技术变革的判断,做的布局。

我们在去年7月份的时候判断过一次,认为今年一季度,这一波技术浪潮基本到此为止了,会涌现出一些技术上具体的小方法,但不构成结构性的大方法。这一段大模型的技术已经进入到开花结果的阶段。

问:是做应用的时机了?

李笛:实际上不是现在,这一波技术创新在去年5月份的时候就稳定了。但是大家还是去卷很大的模型,现在一堆烂尾。所以我不是泼冷水,现在很多人再谈应用,其实已经晚了。

我们跟其他卷大模型的公司最大的区别是,很多人现在是给轮子造马车。而我们不是为了大模型去想一个适合它的产品,是因为我们原本有一个产品,用新的技术去迭代,所以我们有更具体的应用场景,有清晰的盈利模式。

问:活下来的是能找到应用需求、有商业模式的?

李笛:没有能活下来的大模型公司。除非这家公司有一个既有的业务,然后大模型对它既有业务是一种升级。否则,如果把大模型当成公司商业模式的基础,那活不下来。为什么?大模型是个通式,不值钱。它太容易获得了,谁跟谁都不会差太多。

问:找商业模式,是不是你们这10年里比较难的任务?

李笛:在2020年分拆出来之前,我们就做过很多商业模式的探索。

2016年,我们在日本服务了一个大客户,日本第二大超市罗森。我们给罗森便利店做客服机器人,推销它们的优惠券。

罗森用其他的方法,转化率都没有超过10%。但因为我们机器人的情商高,把优惠券发给用户后,三天之内有57%的用户到线下消费优惠券。

罗森从中赚了几千万,我们挣多少?每聊一句话,只挣0.2厘。因为是API调用,即便聊的话创造了很大的价值。我们从那时候感受到,卖API是不挣钱的。

计算机视觉那个时代,有人卖人脸识别API,但不行,所以得卖硬件,做系统集成,做政府项目。那会是一个好结果吗?

今天大模型公司,技术上没有什么独特性,商业模式没有变化,我不是很理解他们兴奋的点。有人指望着说,我是一个大模型公司,我可以自己做出来一个AGI,但问题是,你要真做出来AGI,还给别人提供服务干嘛?

02

小冰的商业模式没变过,一直是“创造人,买卖人”

问:“小冰大模型”获得国内备案,对业务有什么改变?

李笛:对于任何公司来讲,备案意味着入场券,意味着你可以开始跑了。

有这张入场券的公司很多,好像有五六十家。但是模型跟模型还是不一样的,有很多公司卖的是大模型技术,小冰从来都不是卖技术的公司,卖的是产品和解决方案。

对于一个卖技术的大模型公司来讲,备案通过就非常关键了,因为没备案,就没办法上市销售,相当于是个三无产品。

而我们没有任何计划出售技术,所以备案对我们来讲,无非就是规模上的变化,beta标可以去掉了。

问:X Eva的商业模式和一般的to C产品有什么不一样?

李笛:国内AI的to C产品有三大类。

第一大部分是类ChatGPT产品,相比ChatGPT有一些微创新,但没有本质区别。这类产品是一个可以帮人完成工作的助理,类似于Siri的升级版本,沿袭了当年人们对智能助手的想象。

这些产品之间拉不开差距,且用户群体不明确,很多用户体验以后因为没有需求就不再用了,所以产品面临互相卷价格的问题。

第二大类是利用某个垂直技术,做垂直的事情,服务于一批特定的人群,以取得收益。但天然会面临的问题是,同行会用免费来卷,使得商业模式不成立。

还有一大类是,国内的筑梦岛、Glow、星野、彩云小梦等,这一波基本做的是网文角色扮演。你是一个爱幻想的少男少女,喜欢看网文、追剧,你创造了一个角色,很期待跟他交流。这种产品更多时候是自己用。

这个用户群体加起来700万左右,大概就是以前小冰的虚拟男女友的用户群体。但它没有商业模式。

小冰做的产品,和现在国内很多人关心的产品不一样。小冰的X Eva做的是C2C平台。任何一个克隆人都有模板,你可以去拍同款,也可以自己克隆一个。

这个克隆人可以早上打电话叫你起床,晚上给你打着电话睡觉。他会生产各种内容,会唱歌,会说英文。

我们认为,通过广告和电商把免费的模式进行转化,这样的模式不适合AI。每一个人工智能时代的用户都是付费用户。

小冰的商业模式这些年没变过,就是“创造人,买卖人”。所以小冰的平台上没有免费的克隆人,都是付费的,而且我们的利润率很高。我们很可能是目前为止AI C2C平台最赚钱的产品。

其实可以把它的模式理解为淘宝。淘宝上有很多小店店主,他们在淘宝上卖东西,淘宝帮助小店店主卖好东西,让用户能买到他们喜欢的东西。

问:造克隆人,最关键的是什么?

李笛:克隆人最重要的是情感纽带,而解决情感纽带跟技术本身的关系不大。造人,才是目的。

为什么这么说?我举个例子,女生小时候的布娃娃能互动吗?有声线吗?都没有,但舍不得扔,有心事的时候还会对它倾诉,布娃娃脏了破了愿意花几千块钱找人修复。智能音箱功能很多,但稍微旧一点就不要了。

这两者的区别是科技吗?不是,是人的情感投射。

我们在日本有一个项目就是这样。我们给日本30万老年人做家庭智能助理,老年人根据自己的想象用AI创造出一个他想要的人,大部分会创造出他的孙子、儿时的玩伴、逝去的亲人等等,老年人可以跟AI交流,可以得到政府提供的公共卫生服务。这样的克隆人,存在的时长就会大大增加。

不过,大模型让我们做这件事情更方便了,效能提高了。原来创作一个性格,要花大概6个月,在知识图谱上,在基本语料库上做大量分析。现在可以简化成,一个很好的预训练的模型,加上向量数据库,周期从6个月缩短到1天,效果比原来还好。

一个有情感的声线,原来需要录2万个小时,现在我们可以用一句话、1分钟,如果是录5分钟,还能让它唱歌。

但是你拿它干什么,还是最关键的。

我们从2016年开始用AIGC创作,如果只是做内容,往外倾销,就很便宜。如果把创造能力,把性格、才艺赋予到克隆人身上,克隆人就会更有价值。人们会更容易喜爱它,更容易跟它建立长期关系。我认为,长期关系是这个社会最重要的事情。

那长期关系怎么定义?不是DAU,不是我占了你多少个小时,至少不能只以这个维度来判断。

我每天交流最多的是我的同事,而我最好的朋友可能一个月甚至两个月才聊一次,但是他说什么话我都听,这才是长期关系。

长期关系是慢的。所以我们追求的,不是人工智能能黏住用户。如果是这样,那太贵了。因为你每次来找克隆人,平台都在给你掏钱,所以我希望你在关键的时候来找克隆人。

问:克隆人C2C平台上排名靠前的需求是什么类型的?

李笛:我们这个平台上,50万粉丝的网红有1500多个,百万粉丝以上的接近1000个。

其实用户希望得到的是克隆人本人的内容,希望获得TA唱的歌,对TA情感倾诉,和TA有交流陪伴。

这些主播、网红也有私域的服务,只不过他们服务不过来,也有可能做得不好。小冰平台现在能美化TA。

小冰平台和初期的抖音平台有一个共同点,大部分是颜值类网红。但一个很大的区别是,抖音上大部分的网红英文不行,我们平台上所有网红,如果你跟TA打视频电话的时候说英文,TA会用英文交流。我们还怕英文过于标准,显得不太真实,专门调成了“Chinese-English”。

用户还喜欢问网红一些特别奇特的问题,比如圆周率、勾股定理,我们的网红克隆人,人均“量子纠缠”都能解释得非常清楚。总得来说,我们希望克隆人比本人要好,能拓展更多能力。

问:这是一个跟粉丝沟通的工具,有没有计划做明星克隆人?

李笛:对,我们认为这是一个新的平行世界的私域。但为什么不做明星?一是明星容易塌房,第二,坦率地讲,明星市场没有想象中那么广阔,第三,我们做过明星,明星都要求自己跟其他的明星不同,所以很难实现标准化。而创造克隆人这种新事物,一开始最需要的就是标准化。

问:C2C模式怎么避免擦边甚至违规内容的出现?

李笛:这涉及到两件事。一件事是,要想避免公序良俗或者法律意义上的违规,是容易的。但另外一件事,我们到今天为止也没想明白。

假设你希望这个AI是你的女朋友,那在你们一对一的私密对话过程中,克隆人应该用什么尺度?我们应该怎么把握人和人工智能的尺度,今天行业里没有答案,这是个社会层面的问题。

问:怎么规避网红收割粉丝的风险?

李笛:有的是新问题,有的是老问题。对于老问题,我们优选的方案是监管、排查、制定规则、执行规则,只不过以前只能靠人看,现在可以用机器、用新的技术方法来执行。

当然,我们也可以让克隆人执行规则,可能比一味地靠监管去执行更好,那么,就可能变成新问题。

也许,不是网红想“收割”,是机构甚至是平台在收割粉丝。也就是说,网红也得能监督TA的克隆人。所以我们会把克隆人的行为报告给本人,让本人监督。

而且,严格意义上小冰平台不是社交网络,因为你不可能碰见真人,我们严格禁止人和人相遇。

问:跟本站云音乐合作的X Studio,能比人类歌手创造出更惊艳的作品吗?

李笛:唱作作品分为词曲、编曲、演唱。很多公司在做词曲、创作。中国联通彩铃业务是我们生成的,已经做了好几年,词曲虽然很重要,但只有它不值钱,演唱部分是很关键的,这是一个很大的市场。

人们在讨论内容作品比如写诗或者作画的时候,往往会混淆一个概念,它是艺术作品还是内容消费品?

艺术品的评价标准永远在人的手里,而内容消费品可以发挥AI稳定性、高并发的优势。所以我们不是在创造一个经久流传的人工智能歌手,是在创造一批一批比人更稳定的歌手,让原本复杂的创作过程变得简单。

问:AI数字员工业务现在进展如何?to B的生意是不是相对难做?

李笛:目前为止,只要企业做竞标、招投标,我们数字员工的中标率是80%。几大央企、招商局集团的数字员工项目都是我们做的。

在大模型之前,数字员工更多是承担前端的交互,是企业形象代言人,可以生产短视频,也可以是销售。

有了大模型以后,数字员工可以承担一些新的岗位,比如后端辅助侧,企业内部的协同侧。

B端和C端生意各有各的难。如果从兴趣角度出发,我更喜欢做to C的事情,而不是做to B的生意。

03

从微软分拆后,没人给趟坑了

问:现在小冰团队有多少人?小冰X Eva、歌手克隆人和数字员工三个业务的人员投入比例是怎样的?

李笛:我们中国团队有360多人,日本团队有70人。

最大的投入还是框架。小冰最引以为傲的是不仅限于大模型、不仅限于技术创新的一个1000多个Service构成的完整的框架。我们这么多年做的就是这个,所以人员最多。

这本质上是一个通用的框架,既驱动B端的数字员工,也驱动C端的网红克隆人、歌手克隆人。所以,在我们平台上,一个克隆人掌握着另外一个领域看起来截然不同的能力。比如,数字员工也能唱歌。

再往上,B端的工作,交付环节肯定得有技术人员、销售人员。C端也需要人员做产品创新。

问:2024年,从收入的角度,你对哪个业务的增长预期更高?

李笛:我们分别给B端和C端,定了一个差不多的业绩增长目标。哪端能做大都很重要。但是你要问我个人更希望哪个做大,是C端。

因为我认为人工智能发展到这个阶段,就算一个B端的生意,本质上也要和C端打交道。所以我认为做C端的事情更重要。

问:分拆后,你的工作方式、思维习惯发生了哪些大的变化?

李笛:我们是在2020年7月份宣布分拆、同年9月份完成分拆。但坦率地讲,在过去这几年,我们最大的体会实际上是疫情前后的变化,不是分拆前后的变化。

从主观的角度来讲,我个人认为分拆之后,在得的方面是,我们不用再担心小冰给微软惹祸了。

但也有坏处。人工智能很重要的事情在于趟坑。原来我们在微软的时候有一个特别大的好处是,我们趟的坑多。任何一个在人工智能领域出现的坑,微软都有团队趟过。小冰知道哪些地方有坑、有雷,这很关键。但分拆以后,毕竟我们是个独立的公司,知道地雷这种事,比原来少太多了。

问:现在你焦虑的点是什么?

李笛:AI类型的产品很容易作废。我是产品经理,最主要的任务是做产品。所以我自己最焦虑的是,没有把时间花在做产品上。现在我就挺焦虑的,等会咱们对话结束,我一去干产品,就不焦虑了。

问:除了你们探索的方向,你认为行业里其他方向还有没有机会?

李笛:多模态的大模型,需要去追求它已经探明的技术创新,进行落地之外,我个人认为,很多人低估了Diffusion Model(扩散模型)现实存在的巨大价值。

今年如果有其他领域或者同行业的创新,很可能出现在Stable Diffusion这边,而不是大语言模型。

问:具体来说有什么机会?

李笛:比方说,基于人工智能的,特别是视觉化的生成,所对应到的一些协同。

我个人认为它甚至会颠覆掉一大批老牌工具。另外它还有可能直接颠覆到端的,从内容生成、投放,到用户随需定制的整套系统。

当然,我们仍然期待,最后出来的GPT-5是不一样的。市场总有一些东西比你想象得要好。不过,如果它发生了,其实对落地不是好消息,因为大家又会继续去憧憬梦想,不落地了。

编辑 / 金玙璠