比同行低99% 字节挑起大模型价格战

在AI上“迟钝”了的字节,凭借价格“逃逸了一波平庸”。主力模型0.0008元/千tokens,较行业价格便宜99.3%的水平,让外界直呼字节跳动开启了大模型的“价格战”。对行业来说,门槛的下降意味着生态繁荣进程的再度提速,而对字节跳动来说,这场“迟到”的发布会,或许也意味着庞大的字节正在理顺自己做AI的逻辑。

“价格力”

AI也开始讲“价格力”了。5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布,目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等9款模型。

豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。但比起首次集体亮相的豆包大模型家族,价格才是这场发布会最大的意外和惊喜。

“豆包通用模型Pro 32k模型,正式定价是0.8厘/千tokens,比行业价格降低99.3%。”发布会上,火山引擎总裁谭待公布这一数字的话音一落,现场就响起了一阵惊呼和掌声。以至于让谭待重复,“对,没有听错,是降低99.3%”。

相比起来,市面上同规格模型的定价一般为0.12元/千tokens,是豆包模型价格的150倍。火山引擎公布的价格计算显示,一元钱能买到豆包主力模型的125万tokens,大约是200万个汉字,相当于三本《三国演义》。

什么支撑了豆包大模型的定价,这可能是定价消息一出,最先跳出来的问题。在发布会后的群采中,谭待解释称,团队在技术上有非常多优化手段,包括通过模型结构的优化调整,把成本做低、效果做好,通过分布式推理、混合调度大幅度降低部署成本等。

调用量给了豆包低价的底气,而低价则是为了撬动更大的市场。据悉,经过一年的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿tokens文本,生成3000万张图片。谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

“豆包的低价使得更多企业和个人能够负担得起大模型的使用费用,从而降低了大模型技术的使用门槛,这将有助于大模型在更多行业和场景中的落地应用。”北京市社会科学院副研究员王鹏对北京商报记者进一步分析称,低价策略有助于吸引更多的潜在客户,扩大市场份额。随着用户基数的增加,大模型的商业化前景也将更加广阔。

输不起的竞赛

在时间节点上,AI的“价格力”故事也有巧合。两天前,OpenAI用GPT-4o炸场,在API使用方面,相比GPT-4-turbo,GPT-4o价格降低一半,速度提升两倍。

同一天,智谱大模型开放平台上线了新的价格体系。其中入门级产品GLM-3 Turbo模型调用价格下调80%,从5元/百万tokens降至1元/百万tokens。

“从全球范围看,大模型的推理成本,特别是非顶尖大模型推理成本的下降,比之前预估的进度要快得多。”在接受北京商报记者采访时,互联网投资人庄明浩如此说道。

而从国内情况来看,低价可能也是一个必然之举。庄明浩称,相比起国外屈指可数的几家大模型企业,国内大模型的竞争环境更为复杂,头部企业、明星创业公司林立。但与之相对的是,应用层的爆发却慢于预期。因此在技术能力已经进入相对瓶颈的阶段时,尽可能地拓展应用生态,也是商业惯例。

而在头部大模型企业中,大洋彼岸的战况同样激烈。北京时间5月15日凌晨,谷歌正式反击OpenAI,不仅带来了轻量化的模型Gemini 1.5 Flash、AI通用智能体Project Astra等重量级发布,还推出了OpenAI“跳票”了的AI搜索,捍卫了自己在搜索市场上的地位。

对于如今字节跳动是否会引发降价连锁反应的问题,王鹏认为,当一家企业采取低价策略时,其他竞争对手为了保持或扩大市场份额,往往也会采取相应的降价措施。因此,豆包的低价策略很可能触发大模型行业的价格战。

有人甚至戏称,可能要不了多久,企业调用大模型将不再需要成本,甚至企业调用大模型,相应的大模型企业应该提供补贴。这种玩笑反映了两个层面的焦虑,一个在于应用生态,另一个在于市场竞争。

谭待也提到,对企业来说,在AI转型上充满太多不确定性,必须要让试错成本尽量低。

“大模型发展至今,基础技术到达瓶颈,人们迫切想要知道大模型能够做什么,是否真的能实现飞轮效应,这些都需要时间,也需要钱。在这场没人输得起的竞赛中,是否会走向一种极端的价格战,谁也说不清。”庄明浩说道。

而对于烧钱的大模型来说,低价是否会压缩盈利空间,也成为核心议题之一。对此,王鹏认为,降价无疑会在短期内对企业的盈利空间造成一定压力。然而,这种压力可以通过扩大市场份额和提高使用率来缓解。

从长期看,王鹏认为,随着用户数量的增加和使用频率的提高,企业可以实现规模经济,降低单位成本,从而在一定程度上抵消降价带来的影响。此外,企业还可以通过提供增值服务、定制化服务等方式来增加收入来源,以应对降价带来的盈利压力。

“我们不是以亏损为代价做这件事的,亏损是接受不了的。”群采中,谭待也提到,定价的基础是对技术的信心。

迟到的发布会

2024年初的年度全员会上,字节跳动CEO梁汝波给字节跳动2024年定下的关键词是“始终创业,逃逸平庸的重力”。那场演讲中,梁汝波多次提及“危机感”,比如组织平庸化的危机感、迟钝的危机感。

AI也是危机感的来源之一。梁汝波说,公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018—2021年创立的。

这样的评价其实与外界对字节跳动AI线条过于低调甚至“慢了”的印象不谋而合——此前包括豆包、扣子等产品发布的消息,大多是以“网传”的形式而被外界接收,火山引擎原动力大会可能是字节第一场真正意义上聚焦AI的发布会。

而慢了的字节跳动,也需要找回自己的节奏,无论是产品的发布,还是“舞台”上的聚光。

“从传播角度看,字节跳动过去的AI动作其实非常低调,虽然豆包和扣子的数据不错,但可能只有最关心这个行业的人才会知道,声量上远不如智谱、MiniMax等企业。从这个意义上看,字节跳动需要这样一场发布会,让事情回到应有的状态里。”庄明浩说。

事实上,在长达一个小时的群采期间,豆包准备的时长与现在才发布的时间点也被多次提及。谭待给出的回应是,“我们的风格就是不准备好不要说出来”。

在庄明浩看来,字节跳动的“慢”和“低调”,可能都要归结于组织架构的庞大,“大模型一路发展下来,对这些体量超级大、业务超级复杂的公司而言,梳理好自身的AI战略本来就是一件非常困难的事”。

庄明浩举例称,字节跳动有各种各样的产品,也很擅长开发,造成如今的情况,更大可能是内部没有理清楚,到底是以火山引擎还是字节跳动的名义、是以豆包还是扣子的名义,是以to B还是to C的名义讲,这些可能都在字节跳动内部经历了一番博弈,划分清楚之后,才有了这样一场发布会。

巧合的是,群采期间,当被问及字节跳动在AI和大模型业务上的整体战略思考时,现场也有解释提到,谭待主要负责火山引擎的部分,“可以聊聊火山引擎的战略,字节跳动的战略可以回头再聊”。

北京商报记者 杨月涵