对话李开复:先不谈AGI梦想 要接地气、落地为王
11月6日,继10月中旬发布全球 SOTA 的新旗舰模型 Yi-Lightning 之后,零一万物首度对外披露了基于 Yi 模型构建的一整套大模型 ToB 解决方案。基于“Infa+大模型+应用”三位一体战略,零一万物在模型训练、AI Infra 以及应用开发等多个领域积累了成熟的能力,并在自身实践中得到了验证。依托这些能力,零一万物已经为政企客户打造了一整套解决方案,涵盖从 AI Infra 到模型,再到应用落地的全过程。
此次零一万物新发布了面向电商直播、办公会议等场景的“如意”数字人解决方案,还在自身国际领先的 AI Infra 能力基础上凝练出 AI Infra 解决方案,助力政企客户构建大模型算力平台。两项最新亮相的解决方案,结合原有的以 Yi 大模型开放平台为核心的 Yi API、为企业客户开放的模型训练平台,共同构成了一整套“从 AI Infra 到模型,再到应用”的全行业 ToB 解决方案。
目前,零一万物大模型 ToB 解决方案已经与多家世界500强企业客户展开合作,涉及能源、零售、游戏、电商、智算等多个领域,与中国领先的餐饮公司百胜中国、创新型亲子家庭服务商孩子王、新型智能算力运营服务厂商图灵新智算、知名内容营销一站式服务商乐淘互娱、数字化营销服务商直客通等都已签约。
零一万物 CEO 李开复博士表示,以大模型技术为代表的 AI 2.0将重塑各行各业的生产力格局,颠覆现有的企业组织结构和规模。但是目前大模型能力并未在 ToB 应用上释放出全面潜能,只有进入业务核心系统、快速轻量级大批量部署才能最大程度地为企业降本增效。零一万物会继续坚持“Infra+模型+应用”三位一体布局,以垂直整合的商业模式探索 AI ToB 的最佳实践。生成式 AI“长坡厚雪”,零一万物愿与产业内富有远见的头部企业共同探索。
零一万物联合创始人祁瑞峰进一步强调,零一万物将采取“一横一纵”的打法,充分发挥 Yi 系列基座模型的横向泛化能力,在行业纵向做深做透。依赖于零一万物“一横”中的包括世界第一梯队基础大模型在内的全栈技术平台能力,寻找行业核心业务场景,帮助客户实现业务层面、用户层面的增长,或帮助客户降本增效带来 ROI 层面的回报。在为客户带来业务价值的同时,零一万物也会持续打造大模型原生、标准化、可规模复制的应用产品,力求通过云服务的方式多快好省地为客户提供部署与后续服务,以大模型智赋企业数智化,共建新质生产力,为各行各业注入增长新动能。
具体来看,零一万物“如意”数字人,已经实现一机开万店播,互动精确全天候,有客户GMV提升170%。
在接入Yi-Lightning后,“如意”面对直播间里实时用大模型处理大量文字的弹幕提问的响应速度更快、回复质量也有进一步提升,实现了与直播间观众的高质量实时交互。零一万物“如意”已经跑通了包含本地生活直播、AI 伴侣、IP 形象、办公会议、媒体营销等场景。在已有合作的过程中,零一万物“如意”均帮助客户带来了显著的业务提升。其中某头部酒旅企业在接入 Yi-Lightning 全新加持的“如意”数字人直播后,GMV 较此前上升170%。
以本地生活直播场景为例,零一万物的“如意”数字人能够快速提取商品信息、精准识别弹幕意图、自动给出推荐方案,丝滑地与客户原有营销、物流系统互动,实现从引流到下单的全流程陪护。一步到位,完成促单。与“如意”数字人解决方案配套,零一万物还将推出营销短视频解决方案“万视”,目前正在与头部客户共同打磨,很快会正式对外发布。
据介绍,凭借着零一万物“Infra+模型+应用”三位一体的布局,Yi-Lightning 在价格上也直逼行业最低价,每百万 token 仅需0.99元。
数字人之外是AI Infra 解决方案,这是零一万物ToB的又一个发力点。
据介绍,得益于“Infra+大模型+应用”三位一体布局,零一万物从 Day 1开始便注重打造自身 AI Infra 能力,以来自国际顶尖大厂的多位行业高级技术专家为班底,打造了一支世界一流的 AI Infra 团队。截至目前,这个团队具备万卡集群的设计、建设和运营经验,构建过10+ 个超级 IDC,成功训练过多个百亿和千亿参数模型,是全球范围内为数不多拥有这样深厚经验的团队。
今年7月,零一万物曾与新型智能算力运营服务厂商图灵新智算签署战略合作协议,基于全球领先的 Infra 基础架构平台与大模型训练平台的软件栈能力,零一万物将帮助图灵新智算在“黄埔一号”打造全球领先的新一代智算中心,双方在整机密度优化、大模型私有化部署、算法优化、算电协同等六大技术领域展开深度合作。10月末双方合作进一步深入,共同挂牌成立了零一万物-图灵实验室,共同推动以“如意”数字人为代表的大模型应用落地。
“今天在大模型领域内,大部分 ToB 项目都集中在私有化定制模型,如何能够真正让大模型进入客户核心业务场景,形成一个大模型赋能下、标准化、可规模复制的应用产品是未来ToB的一大挑战。”零一万物联合创始人祁瑞峰说。
祁瑞峰表示,从 Day 1开始,零一万物就已经开始探索 ToB 方向,积极寻找大模型在各个场景下的能力边界。一方面需要考虑模型能力,以模型的强泛化性避免 AI 1.0时代非标化、定制重、交付重的商业模式;另一方面则是要考虑推理成本,能够帮助企业客户核算 ROI,在不赔钱的前提下做规模增长,是模型能力在 ToB 方向落地的基础。
在 TC-PMF 的视角下,零一万物采用了独特的方法论,去寻找能够支撑大模型落地的核心业务场景。祁瑞峰强调,第一个原则是帮助企业客户做增长,其次是要做到显著地降本增效,第三,在切实为客户带来益处的同时,是否有成为标准化云服务的可能。
聚焦此次零一万物发布的一整套大模型 ToB 解决方案就会发现,“标准化”与“垂直精细化”就是其中的关键点。
后续,零一万物将采取“一横一纵”的打法,持续与客户深度探索“垂直精细化”新场景,并结合行业和应用场景凝练出“标准化”企业级应用,致力于将世界第一梯队的大模型能力转化为标准化云服务产品,在为客户带来业务价值的同时,跑通 AI 2.0时代特有的可复制增长的商业模式。
以下是李开复博士现场分享实录:
今天重述一下技术定位,零一万物得到的耀眼结果,还有零一万物首次分享ToB方案。我们都知道整个AI 2.0大模型赛道的兴起是由一年半前全球席卷的ChatGPT启动的,当你有一个超级巨大的模型,用它能够微调成各种应用,可以颠覆所有的ToB和ToC场景。在中国,整个AI 2.0的发展,除了激动人心的技术发布,更进入到了“落地为王”的阶段。今天,我们不谈太多AGI和未来的梦想,更多要看到商机在哪里。
从宏观来说,商机就是第三波IT的浪潮,在座有几位年纪年长一点,可能都记得当年PC时代是多么的振奋人心,之后遇到互联网时代。我记得在2009年就分享过移动互联网时代肯定是第二次PC时代,而且会更大。国内有很多的朋友们都不太认可这个观点,但是今天回过头来看这三个革命,可以从几个角度来看。
第一个,只看它对GDP的贡献有多大。在PC时代有一段时间快速成长,之后有点饱和了。很明显,它对全球的生产力有很大的贡献。
第二个我们可以看价值主张,PC为什么能够颠覆?因为它其实让每一个桌面上有一台电脑,虽然现在大家司空见惯,但我年轻的时候这是很让人振奋的事情。移动互联网大家都经历过,也有些可能当时读的小学,有些可能当时已经在工作了,但是无论你们多大年纪应该都记得,移动互联网就是比PC伟大得多,把PC时代的办公应用放在口袋里,而且知道我们在哪儿都能点开各种应用,价值主张远远超过PC时代,用手机上网比用PC上网的用户多很多。
AI时代,智能AI无所不在,随时随地能够上线,而且知道我在哪里还能更强大。因为等于我们有一个超级大脑,有一个IQ非常高的助手,它入驻我们每个应用,从ToC到ToB,是有史以来最大的一个平台的革命。
这个革命的前提是什么呢?还有它的特点是什么呢?其实跟PC跟移动互联网相比,它更大的一点变化就是,我们还在快速推动技术的进步。当时PC基本就是变得更快,变得更便宜,然后移动互联网从3G、4G、5G慢慢迭代,从PC时代花了25年达到了巅峰,移动互联网时代可能花了10多年达到巅峰。这次AI 2.0应该只需要一两年的时间,就会看到进入一个非常巨大的革命。
这个从哪里可以看到?一个是可以看到明显的模型能力在提升,看这页PPT上这条线可能觉得没有多伟大,看起来很平滑,但其实人类的水平只有34.5,而大模型从70以下到90出头了,这个就是一个接近完美不断去逼近的趋势,而且并没有停止的感觉。所以模型不断地在进步,可能一年半前有些人觉得马上应用来了,其实当时的模型不够好,应该差不多是在今年的时候,明显变得足够好了。
但是够好还不够,还太贵,有很多漏洞。比如说不知道最近发生的事情,或者是有幻觉,这些一步步都在被解决。
更让我们振奋的是多模态的时代将来临,也就是说不只是在文字方面它能够做问答、做聊天机器人、搜索引擎,更大的潜力是,以后不只是一个文字的世界,就像刚开始用手机的时候,也就是用QQ、微信聊聊天,最后进入今天的抖音时代,还有各种商业化的机会,所以我们也会看到内容会越来越丰富化。
如果说宏观一点看,每一个时代从PC到移动、到AI,都是这样的一个过程,当我们有一个新的载体,新的技术,新的内容,首先要能浏览,要能创造、搜索和组织,要有更丰富、更多元化的内容,然后你要能靠它赚钱,这是一个不变的定律,今天就看到下一个阶段有多模态的产生。
说实在,行业的多模态发展,技术发展非常快,这些细节不多说,你们都知道了。但是有一点,很多多模态的发展,是基于很酷的DEMO,当然我们都很热爱很酷的DEMO,我从80年代就开始做很酷的DEMO,但是很酷的DEMO不赚钱没用,不产生商业价值没有用,没有价值主张没有用,没有客户愿意买单,无法靠它赚钱没有用,一直欠缺的就是多模态怎么能进入一个商业的闭环赚钱的状态,这也是今天我们想分享的重点。
整个用户界面在革命化改变,过去是经过图形用户界面的体验,下面有数据库、操作系统、CPU,今天整个体验要把它移植到自然用户体验,用语言或语音,机器来熟悉用我们的沟通方式,而不是我们用机器的方式。再下面是模型,还有基础架构,还有GPU,每一点都会带来很多的商机。这个过程也是说以后看到的第三波的革命,可能就不是手机、CPU,而是右边的过程,当我们做这样革命化迁移的时候,机会在哪里?就在我们做AI-first应用,做ToB和ToC的AI-first应用,就一定要坚持Nature UI,彻底改进人机互动的方式,不再只是用图形用户界面,而是机器熟悉人类,不是人类去熟悉机器,这是一个很大的迁移和升级。
另外当我们有这么大的一个架构改变,下面不再是OS架在CPU上,而是模型架在GPU上,有各种技术架构的问题,代表超级计算首先要移到巨大的超算计算中心上,也是为什么今天图灵新智算董事长刘淼总跟我们达成这个合作。
机会在哪里?
ToB商机的机会,一个是多模态一定要进入主流,有商业化。第二个要在基础架构从OS架在CPU上到智算中心模型架在GPU上,这里带来的巨大商机,都是ToB核心点。所以今天讲的ToB不主要是一个单纯的项目制,去亏本拿单子,去争小小的单子打得头破血流。机会在哪里?机会在多模态、创造商业价值、可赚钱的领域,更重要的是我们能帮助客户和合作伙伴赚钱,我们也获得价值认可。基于这么大的一个革命,要改变UI,要做AI-first应用,要把基础架构和集群GPU模型关系处理好。而且我们都知道GPU超级贵,今天为什么大模型公司,尤其是美国炒钱炒得那么疯狂?我们有没有可能把价钱降下来?这是新技术,而且不只是模型的技术,是模型基础架构和合作的智算中心伙伴一起打造最合理的推理成本。
这一切都发明了以后,我们可以期待这样的一个过程,刚开始是提取和输入数据,刚才所说的能够看数据,搜索数据,解析数据,能够写作,能够主动的创作才叫AI -first,不是人写了AI改一改,而是AI主要写。AI这么聪明,我们还让它来做修饰的工作,不是浪费了它的才华吗?应该是它来写作,我们给它提示、建议、管理。
再往下是交互式的,我们要有语音、多模态、自然语言,最终会走到AGI的方向,再推到下一个方向去。不是说做了这个马上就AGI了,AGI其实还是比较长远。可能各位也看了昨天我的采访,谈到对AGI的期望,大概是7年左右的时间,这是我个人的判断。这7年之间会发生很多事情,多模态成为主流,AI搜索成为主流,AI ToC、ToB成为主流,帮助ToB的公司赚钱,被更多的人使用,手机APP被改写,这些事情未来两年都会发生,远远在AGI来到之前就会发生。
进入到ToB领域,我们认为长期来说,ToB领域应该是这样的改变。过去很多公司使用技术往往会有各种不同的部门,当面临一个技术时代来临,一个标准的慢慢走的方法往往是:这个机会来了,我们要不要加几个人?通过增加人的方式来去拥抱新的技术。但是我觉得其实未来我们应该看生成式AI,如果是5年以后回头看今天,会发现跑得最快最成功的公司,它们拥抱技术不是说再加几个人做一点IT、市场、节省客服等等,更重要是思考从上到下发生革命式的改变。
公司的管理者、CEO应该有这样的愿景:整个公司围绕着AI 2.0时代的来临,重新思考每一个部门。而每一个部门那些最强大,比如说在座这几位合作伙伴,他们对新的技术认知是说我们要有非常厉害的战略规划师,他来管理团队的时候,不只是看着人,而是很多时候有很多厉害的智慧大脑快速地生出来,怎么去拥抱这些大脑,让它们来推动我们的业务,带来商业的增长。
PC时代7.8降到5.1,比较有意思的是计算、移动互联网没有产生很大的效果,可能是大家都是用一些社交媒体、短视频得到更多生产力,把好不容易省来的时候浪费掉了。但是AI时代不一样,AI直接把大脑植入公司,直接让AI来做智力活儿,这样的提升会是巨大的,这样的增加,大于当时PC时代所带来的提升。
但是环境里面还有一些挑战,今天我们可以看到真正最赚钱的公司,都是GPU公司,以英伟达为主。因为美国的主流方向是疯狂去追AGI,这有合理性,他们认为堆很多很多的算力可能只要三年就打造出AGI,能够碾压全世界每个公司,成为世界霸主,成为最大的垄断者。昨天你们看了我的采访,这是合理的,但是需要特别巨大的投资,而且忽视了我们需要一个健康的生态。过去PC和移动互联网为什么能产生这么大的价值?是因为最终最赚钱的不是芯片商,也不是平台提供商,而是ToB和ToC的应用,这件事情不发生整个生态不健康,最终创造价值的是贴近用户和企业需求的应用,唯有帮用户和企业得到了价值,提升了价值,创造了经济财富,他们才有可能花更多钱,这些ToB和ToC的应用才能生存下来。这些应用告诉我们的平台、模型和智算中心该怎么做,然后智算中心和芯片才能够赚钱,这是我们现在必须要跨越的,而且是非常适合中国来做的事情。相比之下,美国的公司愿意去冒巨大的风险做一件伟大的事情,哪怕成功概率小,也一定要做,做了成为霸主。OpenAI也是这么起来的,有引领性。只是他们执着把所有的资源都来买芯片,烧更大的模型,最后应用没有起来,带来的生态是相对不健康的,所以我们希望能够扭转这件事情。
在ToB领域,我们想扭转这件事情,就必须要关注到不能只是去做项目制。我有模型要不要买?大部分的企业用户说谁要买模型?要解决方案,帮我省钱赚钱,现在卖模型的方式行不通的,而且当我们要去为客户服务,一定要把客户放在最高的地位,看到那些愿意把模型放在真实有价值的应用公司,有这么几个特性:
第一、判断如何降本增效。而要降本增效不是说丢一个模型就是降本增效,也不是说丢一个模型自己做客服,做不好我来帮帮你就能做到降本增效,一定要能够让我们的技术提供商愿意自己花更多的时间,开发很多跟模型基座有关的解决方案,才能更贴近用户的需求,还有必须要有合作伙伴一起做,不是我们丢一个模型过去,加几个人就能够达到最巨大的价值。
第二、大模型进入核心的业务流程。虽然客服是最低垂的果实,但是并不是最大的核心机会,我们今天会听到合作伙伴他们自己或和他们的客户怎么样进入真实的核心流程。
第三、不能太高的门槛。丢一个模型让客户去微调,大部分企业用户是做不到的,要做继续训练那更不可能,如果还想在上面能够拍脑袋拍出全新的应用会更难。所以我们要引领行业,要打造有价值的方案,自己一定要能够真的撸起袖子,和我们合作伙伴一起,了解用户的需求是什么。而且基于这样的原则,我们在零一万物打造了一个完整的图景,它能够从预训练到训练、到我们提供各种的技术,数据管理平台,还有我们自己的向量数据库、搜索功能,把这些进行整合,这里面很多技术本身并不见得是大模型,但是结合起来能创造巨大的价值。
比如说如果要做一个办公软件,那里面可能就需要有写作的功能、阅读的功能、PPT功能,比如说要做一个很好的数字人的应用,除了大模型之外,数字人同样重要。如果要解决各种幻觉问题,一个很强的向量数据库和RAG是必须的,所以当我们打造平台的时候,都是完整的。而且像刚才所说的真的要落地应用,能够合法合规的使用,还有安全的问题,整个技术架构的问题,还有怎么去跟智算中心合作的问题。
我们不断地开发大模型,去年11月Yi系列大模型达到Hugging Face的世界第一,今年5月Yi-Large成为中国第一的模型,Yi-Lightning推出的MoE模型又继续是中国第一,所以我们对技术有追求,但是技术追求之上,必须要接地气,必须要创造真实的商业价值,必须要找到合理的落地环境,而不是期望着做一个模型抛出来一大堆人丢钱,可能一年半前、两年前大模型刚火的时候,是有一定的机会,但是这个机会如今不可能存在,还需要更接地气,创造商业价值。
未来我们还有更多的期待,如刚才所说的,在一年半前,ChatGPT点燃大模型的元年,今年是模型够好了,推理成本也够低了,今年Yi-Lightning应该在全行业排行世界一流的模型里面价格最低,推理成本最低。所以当我们能够把能力提升了,把推理成本降低了,我们应该水到渠成会看到各种应用一定是会百花齐放,我们会看到各种很棒的应用。在ToB和ToC领域,每一个应用会被改写,还有很多新的应用会出来。
再下面我们认为Agent会创造很大的价值,就不再是问答式的一个输入和输出,而是委托式的界面,我们需要什么,AI帮我们做好。再往下具身智能是很大的机会,未来的四五年,有可能是有史以来最巨大的,而且最快速的技术革命,这是我们对未来的展望。