大模型“自杀式”降价,大厂要掀桌子了?

「核心提示」

降价不是万能的,但大模型这场竞赛,谁都输不起。

当消费者对电商"618"免疫时,大模型刮起了降价的疾风骤雨。

先是字节宣布旗下大模型豆包比市面上的产品便宜99.3%,阿里直接用没有最低、只有更低回应,API输入价格降至0.0005元/千tokens,比豆包便宜近四成,百度、科大讯飞甚至官宣"免费"。一时间,大模型大有砸穿地板价之势。

价格战是互联网行业常用的竞争手段,过去在网约车、共享单车等领域屡试不爽。大厂财大气粗,"烧钱"把一众对手、小公司熬走后,剩者为王,开始收割市场。难道这一幕又要在大模型上演?

尽管零一万物CEO李开复等大佬公开呼吁,大模型要避免OFO式流血烧钱的打法,可价格战一旦开打,不分出个胜负就不会轻易停下。在一些业内人士看来,上游的大模型降价,会促进下游应用层的创新和繁荣,然而,比成本更严峻的挑战是如何变现。

这场大模型的"618"将如何收场?

"618"的风,吹到了大模型

今年电商"618"大促从5月20日打响,而价格战已提早在大模型开打。

5月15日,字节率先开始跳动,宣布旗下大模型豆包在企业端的价格降至0.0008元/千tokens,称较行业便宜了99.3%。为了形象说明促销力度有多大,字节举例称,相当于花一元就能处理三本《三国演义》文字量的内容。

在C端,豆包早已主打"免费"获客。在抖音上,大量引导下载豆包APP的广告称,这是一款免费的大模型APP,可以是用户的音乐台、搜索引擎、翻译机、写作助手、口语教练,只要安装了,手机里大部分APP都可以删掉。

当豆包官宣降价时,阿里通义千问、百度文心一言被狠狠背刺,彼时,两家的报价约为0.12元/千tokens。于是,一场低价的肉搏战不可避免地爆发了。

5月21日,阿里通义千问主力大模型Qwen-Long官降97%,API输入价格从0.02元/千tokens降至0.0005元/千tokens,比豆包更便宜。百度更直接宣布,文心一言两大主力模型ERNIE Speed和ERNIE Lite即刻全面免费。随后,腾讯、科大讯飞等相继公布了自己的降价政策。

70多年前,人工智能的概念被首次提出,此后经历了多轮技术浪潮,但真正掀起AIGC热潮还是在近几年。2022年底,ChatGPT横空出世,点燃了AI爆炸式增长的导火索,国内的大模型也迎来井喷式发展。

特别是对有技术沉淀又不差钱的大厂而言,大模型能力正逐渐趋同,彼此间短期难以拉开差距。当国产大模型摸着GPT-4过河后,AI也到了从研究室走向大众应用的阶段,把用户真实的使用数据反哺给大模型,进行训练迭代。

此时,用户体量就显得至关重要,谁的用户多,产生的数据就丰富,投喂给大模型的"饲料"就多,越有可能训练出更好的AI。为了换市场份额、数据量,以价换量就成了必然结果。

此外,大厂降价醉翁之意不在酒的意味明显:用低价的大模型引流,带动背后云服务的销售。

"公有云+API"被认为是企业使用大模型更具性价比的模式。在官宣降价后,5月21日,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,公有云的技术红利和规模效应,带来巨大的成本和性能优势,能大幅压缩模型推理成本、加快推理速度。

看到了其中的门道,不少行业资深人士对此番价格战持看热闹的"吃瓜"心态。猎豹移动董事长兼 CEO傅盛在朋友圈发文称,这次价格战,降得最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。大模型创业公司没有这样的生态,必须找到新的商业模式。

5月22日,百川智能发布最新一代基座大模型Baichuan 4,创始人王小川在媒体交流会上表示,核心要看背后的商业模式是什么,如果是做to B服务的,降价的根本目标不是为了卖大模型本身,而是带动整套云服务的销售。这推动云厂商从偏传统的服务模式,进入到一个新战场。

在他看来,此次价格战是B端策略,更像是"四小龙"(商汤、旷视、依图、云从)的降价方法,而不是像美团、滴滴直接抢C端用户的价格竞争,不是改变生产关系,而是直接做生产力供给。对创业公司而言,更像是吃瓜看热闹,别掺和进去。

"白菜价"便宜了谁?

大模型降价,被不少市场人士认为有利于下游应用层的创新和推广。随着大模型降至"白菜价",下游创业的机会来了吗?

目前,大模型主要向B端收费,对C端收费的较少,且用户付费意愿较低,这注定了大部分C端用户对价格战的感受并不明显。

在C端,不少大模型APP采用的是"对话体"界面,即用户输入一段文字,大模型给出相应回复,使用体感类似用微信、QQ跟朋友聊天。每给出一次回复,背后都在调用大模型,C端用户不需要为聊天付费,但提供聊天服务的机构却要为此买单。也就是说,API调用是一门亏本买卖,大模型越贵,亏的就越多;大模型降价,就能少亏点。

打个形象的比喻,调用大模型相当于手机的流量费。在移动互联网初期,流量费很贵,用户舍不得开流量,手机里的APP有限;当资费大幅下调后,手机才迎来了APP的百花齐放。

百度创始人李彦宏曾公开表示,中国有数百个基础模型,是对社会资源的巨大浪费,不应再去卷大模型,更应该卷应用层。

而价格是限制应用层创新和大规模应用的重要因素。

价格是调节供需的重要手段,上游大模型降价很可能会带动下游应用层的创新和繁荣,推动AI的普惠化,大厂也就借此搭上大模型应用生态的快车。

在王小川看来,降价意味着大厂实在太看好大模型的前景,不愿失去,反映出对这个时代AI的能力有足够多的憧憬。

一些细分赛道将从降价中收益,例如数字人直播是AI应用的热门领域之一,此前,不少数字人需要先"投喂"文案才能驱动,接入大模型就为数字人注入了"灵魂",可以根据观众提问进行互动,而不是生硬的念台词。

用户跟数字人互动,实际上调用的是大模型资源,当大模型价格降低90%以上,不仅"聊天"费用大大降低,还能更自然理解和回应人类语言,面向C端场景的数字人潜力将被极大释放。

但在更多领域,应用侧的发展遇到了瓶颈。在Chat-GPT刚推出时,不少用户对"聊天"的交互模式感到新鲜,引来不少模仿者,直接"套壳"某个大模型推出自己的APP,导致的后果就是交互效果很生硬。在主流大模型性能趋近的情况下,这一"机器人式"的交互模式对用户的吸引力正不断下降。根本原因在于很难找到跑得通的商业模式和细分市场。

5月22日,李彦宏在"欧洲科技创新展览会"(Viva Technology)上表示,在中国,无论是初创公司、还是互联网大厂,都在努力寻找PMF(产品市场契合度),致力于探索最能发挥生成式AI能力、能被数十亿人使用的应用形态。但目前无论是欧美还是中国,超过1亿日活的超级应用都尚未诞生,目前还不确定超级应用最可能的形态,可能是一个聊天机器人,或者是Copilot(微软的AI助手)。

数量众多的创业公司扮演了探索、验证商业模式的角色,但成功跳过龙门的并不多。在Lepton AI创始人贾扬清看来,目前只有两大类应用已经跨越死亡谷,开始产生持续的流量。一是提效类,例如用AI快速生成商品展示图片,能节省大量拍摄和模特的费用;一类是娱乐,以AI的方式做角色扮演及交互。大量的传统行业应用,都是AI值得探索的深水区。

"Super APP会有,但是会很少。"贾扬清说。

降价不是万能药

在众多业内人士看来,价格不是判断模型好坏的标准,关键是要让更多人用起来。靠低价不一定赢得竞争,最能落地的或许会笑到最后。

电商、金融、市场营销等被认为是大模型应用更有前景的领域。5月25日,蚂蚁集团研究院院长李振华在公开演讲中透露,2024年一季度,Azure云收入中由AI服务带来的收入达到7%,其中金融行业占10%。

当大厂拿出价格武器,叠加"云"、技术优势亲自下场收割这些细分赛道,中小创业公司的处境或将更加艰难。

眼下,互联网大厂正加码大模型及应用层。2023年11月,马云在内网发文称,AI电商时代刚刚开始,对谁都是机会,也是挑战。在电商场景中,阿里推出"淘宝问问",向用户提供比价、凑单、商品推荐等建议。而在电商之外,阿里云推出的妙鸭相机一度引爆社交媒体,又通过投资月之暗面、MiniMax等大模型初创公司,储备更多可能性。

字节跳动的张楠更是选择放下包袱、从零开始,辞去抖音CEO,聚焦剪映,探索AI在内容创作、社交互动上新的体验。"莫奈花园"等AI一键生成视频功能,让央视主持人尼格买提欲罢不能,连发十几条该主题视频,被网友戏称"在莫奈花园买房了"。他本人也发视频辟谣称,自己没有被绑架,精神也正常,只是单纯喜欢这种风格。

在大厂涉足的领域,留给小公司的机会不多,通常结果只有两个,要么被兼并,要么在夹缝中艰难求生。

何况在C端,如何变现依然是让人头大的难题。从AI从业者的反馈看,被互联网免费模式宠坏了的C端用户付费意愿很低,使得AI在应用层缺少明确的盈利路径,做C端的大模型应用可能连电费都赚不回来。价格战解决了供给端的成本问题,却没法解决需求端的付费问题。

即便是背靠阿里、2023年火爆网络的妙鸭相机,当用户想要生成无水印的高清美照时,需要交9.9元,就是这笔费用,劝退了不少用户:尝鲜可以,但掏钱很难,即便有些人愿意掏更多钱去线下拍一张效果类似的"海马体"。

实际上,API调用只是大模型变现的途径之一,还有付费订阅用户、打赏等模式。5月21日,零一万物CEO李开复在跟媒体线上交流时表示,目前API模型调用的比例还很低,不过行业每年的推理成本会降低,如果一年降10倍,就能让更多人可以用上。

这或许是价格战之外传来的为数不多的好消息。