超越 GPT-4o 零一万物Yi-Lightning 登世界第六 李开复:绝不放弃预训练

10月16日消息,继上半年千亿参数模型 Yi-Large 之后,零一万物正式对外发布最新旗舰模型 Yi-Lightning。在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

零一万物 CEO 李开复博士表示,Yi-Lightning 的出色表现是零一万物“模基共建”战略落地的又一里程碑。作为兼具性能与性价比的新旗舰模型,Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。

“中国大模型产业进入到了“耐力赛”阶段,如何让大模型赋能千行百业,提升企业新质生产力是一个重要的命题。这不仅将牵涉到“大模型+行业”的未来发展方向,甚至会影响世界的创新版图。”

我们注意到,这是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩。在一众国内模型中,Yi-Lightning 紧随 OpenAI、 Google 之后,与xAI 打平,进击全球前三大模型企业,居世界第一梯队大模型公司之列。

作为模型落地的典型场景之一,翻译场景十分全面地考验了模型语言理解和生成、跨语言能力、上下文感知能力,通过 Yi-Lightning 与Qwen2.5-72b-Instruct、DeepSeek-V2.5、Doubao-pro 的对比,Yi-Lightning 的模型性能也得到了最直观的展现:

Yi-Lightning 在推理速度和推理成本方面同样有所突破——较上一代旗舰模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成。在与 GPT-4o 的对比中,Yi-Lightning 的生成速度堪称“极速”:

价格方面,仰赖于自研 AI Infra (AI基础设施) 能力,零一万物将最新旗舰模型 Yi-Lightning 的 API 价格降至极低水平,每百万 token 仅收费0.99元。

据李开复介绍,经过一年多的沉淀,零一万物的“模应一体”战略在 ToB 领域内有了更直观的体现。目前,零一万物已推出了 AI 2.0数字人解决方案、全行业解决方案、AI Infra 等产品及服务,面向 B/G 端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

基于以 Yi Lightning 模型为代表的 Yi 模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与 AI 1.0时代完全不同的数字人解决方案。

其中,角色大模型为零一万物 AI 2.0数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。

得益于零一万物在文本理解、多模态方面的模型能力,搭载角色大模型与直播声音大模型的零一万物 AI 2.0数字人在形象更为逼真、声音也更贴合垂直场景的需求。

但与AI 1.0时代的数字人相比最为本质的不同点在于,零一万物为 AI 2.0数字人配备了“AI 大脑”——在电商话术大模型加持下,数字人能够基于模型自有知识库与外接数据库,自主生成直播话术,也能够快速、精准地识别直播弹幕的互动意图,给出对应解答。

除直播外,零一万物也为数字人客户准备了 AI 2.0门店短视频解决方案。客户可通过极简流程,随时生成、超低成本和高品质营销视频视频,解决了传统真人短视频的成本和制作周期问题。短视频与直播内容相互配合,为商品提供持续曝光,提升转化率。

据披露,目前,零一万物的 AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入 Yi-Lightning 全新加持的数字人直播后,GMV 较此前上升170%。

不仅如此,截止目前,零一万物 ToB 解决方案已在零售、医疗、教育、物流等领域内完成落地,涉及 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。自今年6月开始,零一万物相继宣布与阿里云、360、顺丰科技、飞书、钉钉、钛动科技等企业达成合作,已积累起了一批包含世界500强企业在内的付费企业客户。

据悉,Yi-Lightning 正式接入后,无论是标准化的全行业解决方案,还是更聚焦垂直领域的私有化定制业务,都迎来了更多可能性。

附李开复与媒体对谈实录精华:

问:模型做到“世界第六,中国第一”,同时以较低的价格推向市场,是如何实现的?

李开复:零一万物在 Yi-Lightning 的定价上并没有亏本。成立第一天起,零一万物同时启动了模型训练、AI Infra、AI 应用三大团队,三个团队成熟后,再对接到一起。零一万物将这一模式总结为模基共建、模应一体两大战略。AI Infra 助力模型训练和推理,以更低的训练成本,训练出性能领先的模型,以更低的推理成本支撑应用层的探索。我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天 0.99 元/百万 token 的价格。挑选模型 API 最重要的一点,是模型性能一定要优秀,在这个前提之下才去挑最便宜的,我相信,综合 Yi-Lightning 的模型质量和价格来看,Yi-Lightning 很可能是很多开发者最认可、最高性价比的模型。

问:此前有消息称,大模型“六小虎”(零一、智谱、百川、MiniMax、月之暗面、阶跃星辰),其中某几家放弃了预训练。站在行业的角度,逐步放弃模型预训练会成为行业整体趋势吗?

李开复:做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活。需要有懂芯片的人、懂推理的人、懂基础架构的人、懂模型的人、很好的算法同学,一起做出来。如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,我相信中国绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司做预训练。不过据我所知,这六家公司融资额度都是够的,我们做预训练的 production run,训练一次三四百万美金,这个钱头部公司都付得起。我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。

问:零一万物首次公布 ToB 相关矩阵,未来会进一步在 ToB 方向深耕吗?

李开复:在国内,大模型 ToB 相对于AI 1.0 时代有不同的打法,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法。能得到比较高利润率的订单再去做。今天零一万物推出的 AI 2.0 数字人解决方案不是做一单赔一单的做法,它专注到用户重大的痛点需求和盈利点,也就是一个店长或 KOL 平时做一次直播浪费最重要的资源——他的时间。这个时间就算做一小时直播能赚到一千块钱,也就是这一千块钱,但如果用数字人直播就不是一小时了,可能可以做一千个小时(直播),哪怕每一个小时只能赚一半的钱,一千个小时还是可以赚五百倍的钱,这样账就很好算了。如果真的能把数字人做到端到端,只要输入公司内部的东西,选一个形象、声音按一个钮就开始直播,等于卖给这个企业一个印钞机,印钞机要收租赁费就可行。除了直播以外,我们的 AI 2.0 数字人解决方案已经跑通了更多业务场景,比如 AI 伴侣、IP 形象、办公会议等等。整体来看,零一万物 ToB 整体解决方案会采取「一横一纵」的打法。先将单个行业做深做透,进而以自身技术能力和行业积累为基础,凝练出标准化的 ToB 解决方案,为各行各业的企业客户将本提效。

问:除了数字人解决方案,零一万物是否还有其他 ToB 解决方案?

李开复:除了我们已经发布的 AI 2.0 数字人、API 之外,零一万物目前还有 AI Infra 解决方案、私有化定制模型等其他 ToB 业务,我们会在近期正式对外发布,敬请期待。

问:零一万物在海外推出 ToC 产品,国内陆续推出 ToB 产品,当前在 B 端、C 端的产品现状如何?

李开复:一个大模型公司同时做 ToB 和 ToC 很辛苦,销售方法、利润的比例、需要多少投放才会有收入等评估体系完全不同。也需要多元化的管理方式,因为两个团队的基因不一样,做事的方法、衡量 KPI 的方法都不太一样。我在这两个领域有经验,也在试着做,但也绝对不能什么都做。ToB 上,零一选择做国内市场,是因为找到了一些破局的空间,比如用数字人来做零售、餐饮等,能做一个完整的解决方案。另外还有两三个领域开始在做,现在还不方便披露。ToB 不做海外市场,是因为全世界的范畴里,ToB 供应商基本都是当地的。选择在国内做 ToB,还要选择有利润的解决方案做,而不只是卖模型、不只是做项目制,这是我们 ToB 的做法。ToC 我们主要布局海外。当我们开始做零一万物时,国内还没有合适的中文模型,只有在国外先尝试,迭代了一个、两个、三个产品,这些产品现在表现有些很好,有些没有那么好,在不断地调整中。我们也在观察什么时候适合在国内市场做什么样的产品,目前做 ToC 产品面临一个很大的问题——流量成本越来越高。我们也看到有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个环境里,我们会非常谨慎,先不推出中国本土新的 ToC 应用,同时已有的产品还会继续维护,但更多的精力会在海外的土壤用更低的成本买到非常高质量的用户,或者能直接把 App 卖出去,让用户来订阅收费,那边订阅习惯相对成熟。换句话说,现在现状选择在海外做 ToC 产品,变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出。

问:今年5月,Yi-Large 把中美顶尖模型的时间差缩短到六个月,这次 Yi-Lightning 发布直接击败了 GPT-4o,把时间差甚至缩短到了五个月,你觉得之后中美大模型如何缩短时间差?

李开复:缩短时间差非常困难,我不预测我们可以缩短这个时间差。因为毕竟人家是用十万张 GPU 训练出来,我们用的是两千张 GPU 训练出来。Yi-Lightning 的效果是因为团队和社区大家都热心聪明去使用,去理解对方做出来的东西,再加上我们自己每家的研发有特色,比如数据处理、训推优化等等,现在这一套方法论在零一万物已经成熟了,我们有信心把自己的创新加上我们的一些特长,在关注 OpenAI 和其他公司发布的新技术,尽快地去能够了解这些技术的核心重要性,然后把它的能力在我们自己的产品里面发挥出来。我觉得这套方法保持在六个月左右,就已经是很好的结果了。如果期待破局,可能需要一个前所未有的算法才有机会。我们千万不要认为落后六个月是一个很羞耻的事情,或者一定是要追赶的事情,因为我很多海外朋友都认为中国会远远落后,人家十万张 GPU 等,我们要被甩掉三年、五年甚至十年都有可能,现在零一万物证明了不会落后这么多,而且这次 LMSYS 的榜单上也有其他两家中国公司表现不错。