大模型,开战
“整个晋西北都乱成一锅粥了。”此时此刻,《亮剑》里的这句话用来形容大模型领域的竞争,竟然显得意外合适。
五月刚刚过半,全球数得上名号的大模型玩家——包括OpenAI、谷歌、腾讯、阿里、字节跳动等,突然一窝蜂地抛出大动作,有能力突然全面升级的,有大模型转为开源免费使用的,有价格剧烈下行掀起价格战的,景象热闹非凡。一开始,大家也许只是想在OpenAI预定的发布会时间凑个热闹,没想到炸出了一堆“大招”。
在这场颇具火药味儿的军备竞赛中,我们发现,大模型的赛场上,似乎已经只剩下中美两个大国的巨头还能留名。“爆炸式”竞争背后,是整个领域迟迟找不到合理商业模式的困境。或许,巨头们要因此“疯狂”起来了。
大模型突发“爆炸式”竞争
世上的事,最怕一个“巧”字。阿里肯定会有这种想法,因为5月这轮技术大爆炸,居然是它开头的。
5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo。在通稿中,阿里直接用上了“地表最强中文大模型”的形容,中国大模型因此进入与国外一流大模型一较高低的竞技场中央。而在开源领域,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,同样成为行业最强。
彼时,距离OpenAI发布会还有一周时间,阿里估计自己也没想到,七天后,全球大模型领域巨头突然集体狂飙:
5月14日,李开复领导的零一万物正式发布千亿参数规模的 Yi-Large闭源大模型,斯坦福评测机构 AlpacaEval 2.0的排行榜上,Yi-Large 模型的英语能力主要指标仅次于 GPT-4 Turbo,Win Rate 登顶世界第一。
无独有偶,李开复也说,一年前的中国大模型相比美国太落后,现在已经赶上,且零一万物的下一代大模型要冲击GPT-5的水平。
紧接着,王炸登场。5月14日,OpenAI凌晨发布最新旗舰大模型GPT-4o,它是听说读画都全能,甚至可以根据正在对话的人的语气和状态,自主调节回复逻辑,全模态真人交互跟“成精了”一样。而更让业界震惊的是,它居然免费,付费则可以获得五倍的使用容量。OpenAI说,GPT-4o的“o”就是“omni”的意思,包罗万象——野心可太大了。
转眼天亮,中国玩家又跟上节奏了。腾讯于5月14日白天宣布,和Sora同架构的混元文生图大模型直接开源,免费商用。评测数据显示,这可是目前效果最好的开源文生图模型。腾讯这个动作,倒是很有其一贯的风范,你们都卷是吧,我直接把使用门槛取消,先抢用户再说。
白日落幕,5月15日凌晨,谷歌召开2024 I / O 开发者大会。这是一场很急的大会,因为谷歌一口气扔出来十多款产品,堪称AI“大乱炖”,目的就是狙击OpenAI。其中,包括Gemini 1.5 Pro正式开放给订阅了Geminni Advance的用户,上下文窗口拓展到200万token,推出开源模型Gemma2.0、文生图像模型Imagen3、视频生成模型Veo等。
5月15日下午,字节跳动上场了。在2024 春季火山引擎Force原动力大会上,字节发布豆包大模型家族,同样包括多模态大模型。豆包就是原来的云雀大模型,据字节披露,目前豆包大模型日均处理1200亿Tokens文本,生成3000万张图片,全平台用户超过2600万,应用下载量也位居AIGC行业第一。
仅仅是总结这些巨头的发布动作,便已经让人看花了眼。要知道,这里面还不包括那些不发新品,但是开打价格战的铁血玩家们。从年初Kimi的爆火开始,大模型领域的热度和讨论度似乎又到了新的台阶,所有大厂都在此时用实际行动表态:过去一年,它们都在养精蓄锐。现在,巨头要让大模型领域燃起硝烟了。
混乱之中,寡头格局已成型
其实,从这些动态中,我们也能读到一点别的意味:中国和美国的大模型巨头,基本上是在每天轮流唱大戏。白天中国公司放消息,晚上美国公司又顶上,这才连续震撼了行业。而这个过程呢,随便哪个名字都是行业里无人不知无人不晓的。其实,这就是两个趋势了。
第一个趋势,是大模型行业的寡头格局已经形成了。典型的特征是,上述炸场动态基本都是巨头大模型产品的重磅升级迭代或者商业上的重要变化,并没有哪个新玩家蹭上这波热度。
实际上,对一个刚刚火起来没多久的行业来说,这么快进入寡头竞争有点让人惊讶。但考虑到大模型发展本质上是算力、数据、算法三方面的大比武,只有巨头和资源能力强的玩家能做,也并不奇怪。一开始,这个行业就只给很少的企业留了机会。像Kimi这样有点技术的,也是靠着差异化的长文本打法才有机会成长起来,结果也迅速让阿里、百度等巨头比下去了。
第二个趋势,就是国家问题了。大模型的国际态势已经很明显了,和互联网差不多,又是“美领跑,中紧跟,其他区域跟不上”的态势。唯一一个可以算得上例外的,应该是欧洲独角兽Mistral AI。但是,这家公司能有个竞争位置,依然是因为OpenAI看好它。这个行业,确实没有中美之外的其他可能性了。
所以,我们不如来想一想,假设现在的寡头们都能继续走下去,他们会怎么塑造市场格局?赢者通吃还是多个赢家并存?这比较难判断,但要说大模型能一直“无序”竞争,资源肯定是不足的,至少英伟达连显卡都生产不过来。既然这样,通过对大模型领域进行分层,我们可以略微推导一下这些公司的发展方向。
一方面,是行业大模型和基础大模型的分层。这次一起拱火的巨头们,都是基础大模型的一把好手,所以我们不妨看看没有蹭这次热度的大模型玩家在做什么——像科大讯飞、商汤等大模型玩家,其实已经在重点发展行业赛道。科大讯飞星火大模型,和商汤日日新大模型,都已经在汽车、教育、工业等赛道探索落地。而今天字节的发布会上,字节也请来了捷途汽车相关部门负责人等,讲述大模型的行业应用,并发布智能终端大模型联盟,矩阵式进攻。
其实,这是一条不错的路。“基础大模型→行业大模型→终端应用”,是行业比较认可的发展路线。基础大模型非常吃资源,也就是超级巨头才卷得过。而行业更需要垂直领域的Know-How,懂行业、懂客户,就能取得一定的成果。
另一方面,是开源大模型和闭源大模型的交锋。OpenAI和谷歌为代表的巨头,采用闭源大模型,而阿里、腾讯、Meta、Mistral AI,都在开源上下功夫。要强调的是,这并不绝对,比如Meta和Mistral AI都是主要把精力放在开源上,而阿里腾讯都是两者兼有,但对开源的态度很开放。OpenAI则是关起门来自己玩的纯闭源选手。
至于为什么要开源,或者要两手把握,原因就像前面说腾讯的时候提到的那样,开源模型意味着垂直行业的公司想用,就不用从头训练大模型,其实间接减少了对闭源大模型的需求——作为巨头,我闭源干不过你,直接让用户先用上便宜好用的大模型也可以,你的客户少了,我反正更安全。
说到底,现在大模型并没有一个真正意义上特别稳定的商业模式,卖会员、卖行业大模型,都只是阶段性尝试而已。整个阶段,这些巨头一方面在想抢客户,另一方面其实需要防备客户太倾向哪个大模型。于是,我们就在这场集体爆发里,看到了这么多的“拉扯”。
拼落地,商业模式仍缺思考
那么,现在大模型行业对商业模式的思考和探索,具体到哪一步了?现在,它们有什么明确的竞争焦点了吗?这些问题,都是有答案的。
先来看最基础的商业模式表现,虽说行业确实有点迷茫,但正面的进展是不少的。比如,字节跳动豆包平台上已经有超过800万个智能体被创建,2600万的用户量也在行业高度领先;零一万物透露,其海外生产力应用总用户接近千万,今年C端单一产品收入已经达到1亿元;通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,就连小爱同学也和阿里牵手;百度则表示,已经有近10万家企业调用文心一言能力,百度文库的AI能力,每天有250万用户都在用。
说起来,商业化无非就是两派——GPT、Kimi、文心一言会员、豆包等平台上的智能体,都是C端应用的代表;反之,阿里把通义大模型嵌入钉钉、科大讯飞和商汤给客户定制的行业大模型,则是B端应用的代表。出现这种划分,其实也就是公司基因的继承,像阿里、腾讯、字节等公司本身就是双端业务拓展,B端和C端自然都能做,而商汤这种一开始就做B端业务的公司,要用AI拿到新订单也更容易。
所以,严格来说,大模型的商业化落地其实要思考“AI+”(以AI技术赋能行业的科技企业)还是“+AI”(采用AI技术的传统企业)的问题。目前,无论是GPT这种“技术即产品”的方式,还是阿里、科大讯飞定制化和嵌入化的方式,目前都没有突破传统商业模式的范畴,估计不一定是大模型的终极形态。
更严峻的问题是,我们必须承认,当阿里、腾讯都在开源,当GPT的能力、谷歌Gemini的能力都有所重合,无论B端还是C端客户,选择单一大模型的动力其实有点弱了。因为大模型的基础能力都差不多,无非是这个月我第一,下个月你第一,很难分出差异来。这个时候,竞争的焦点其实不在能力上。
在哪呢?QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,和移动互联网几十亿用户比起来真是“洒洒水”的程度。为什么大众没那么乐意用呢?因为开源模型要部署,而收费的模型真的不便宜。文心一言的用户数已经突破2亿,专业版连续包月也要49.9元一个月,你说其中能有多少付费会员?
如果用户规模不够,从实战收回的反馈数据就不够,大模型要向能用、好用的水平发展,就会更麻烦。所以,为了让大模型加速落地,价格战已经打起来了。
行业其实有个平均水平,0.12元/千tokens。但是,这根本限制不了巨头大降价的决心。
字节是个狠人,豆包模型在企业市场的定价低到了0.0008元/千tokens,比行业均价便宜99.3%。炸场的OpenAI价格也很炸裂,API价格打五折,速度还提高一倍,新推出的text-embedding-3-small模型,价格仅为上一代的五分之一,每1000个tokens的价格从0.0001美元降低到0.00002美元。
另外还有一些默默用价格卷同行的玩家,比如智谱AI,入门级产品GLM-3 Turbo,一块钱就能买100万tokens。
为什么卷生卷死?还不是因为单纯的技术竞争,其实已经暂时无法出现质的变化,最大的代表就是,OpenAI的GPT-4o很惊艳?很可能是GPT-5有点难产,才只能用这种进步来搪塞一下市场。
而大模型坏就坏在,这个领域太新了,如果没有新的技术把水搅浑,一旦用户开始习惯了用某个大模型,市场格局就会很危险。所以,没有人希望这个领域太冷清,越热闹、越疯狂,才能保证自己不被洗出局。这个领域没有“王”,不管中国公司还是美国公司,比的就是谁敢闯、谁更狂。