智谱AI COO张帆:AI整个发展历史,就是AI普惠的过程
智谱AI COO张帆:大模型时代,如何构建产品力(来源:本站科技频道)
12月22日,第十届以“智能涌现·发现未来”为主题的本站未来大会,在杭州开幕。大会包括思想之夜、未来局、未来公开课、主论坛、AGI论坛、汽车科技论坛、灵感无界等,广邀顶级学者、产业专家和行业精英,作答未来科技、人文艺术、时代个人的精彩变化。
在未来大会AGI论坛,智谱AI公司COO张帆分享了《大模型时代,如何构建产品力》主题演讲。张帆表示,2023年GhatGPT的横空出世,让人们扭转了以往AI概念先行的现状。在深刻感受到大模型强悍能力后,行业对于大模型落地实践更加期待。
不过,张帆表示,企业要想把握住大模型赋能的机会,首先要正确看清自己,在数据、业务等环节是否做好链接的准备,并且责任到人,高度重视。其次,企业要对自己内部数据有甄别,为大模型提供高质量数据。
谈到大模型时代企业该如何构建自己的竞争力,张帆表示,企业应该选择一个稳定、长期持续更新的基座模型,有足够丰富的产品能够满足自身业务。其次,大模型要和企业彼此适合,并且实现真正的正向循环,并产生新时代的数据资产。
以下为为智谱AI COO张帆演讲节录:
很高兴今天有机会能够跟大家一起来分享我们在大模型上落地的经验和探索。我觉得站在现在这个时间点,大家讨论大模型,更多的还是“模型为王”,总是在看参数和指标,但是我相信到2024年,会变成“价值为王”,大模型的价值体现在哪里?大模型该如何落地?这是有志于从事大模型行业的人都必须回答的问题。
我们希望和大家分享一点如何将模型落地和应用的思考,从我们如何帮助大家把模型的能力落地到我们的业务当中提供一些我们自己的建议。
我们先来看为什么今天大模型有价值,或者说为什么要落地它?ChatGPT发布两个月内全球用户破亿,这是人类现象级的增长,是人类所有历史上前所未有的速度,而且增速非常快,这次风潮跟以往不一样,以往看到新技术出现一定是概念先行,无论是Web3还是元宇宙,我们都是先有一个非常好的愿景,我们设想它在未来会逐步落地。
大模型这一次和以往完全不同,我相信绝大多数人了解到这个技术的时候并不先是概念,而是先看到了ChatGPT这款产品给我们带来了震撼,发现了它的价值,才发现背后有一个东西叫大模型,所以它天然就具备落地的属性。
这反映出了一个根本属性上的不同。我们可以看到,AI的整个发展历史就是AI普惠的过程。AI已经有近百年的历史了,从上个世纪四十年代就有AI,太远不讲,从移动时代来讲,一方面,我们发现在那个时候生产AI和消费AI的成本非常高,但另一方面,其实我们在那个时候已经在应用AI了,无论是搜索引擎、计算摄影还是推荐算法,我们都已经用到了AI的能力。
但在当时所有的任务几乎都是要定制化的。如果要做任何任务,我需要找到并定义好对应的任务,收集到对应的数据,选择算法去训练模型再应用。这就导致了AI的成本高企,当时我们看到基本上只有互联网大厂有能力使用AI。
这一波人工智能浪潮的1.0版本,也就是2013年、2014年的时候,我们注意到神经网络的算法开始逐渐走向成熟,一个明显的特点是不需要那么多的算法了,另外神经网络在训练模型时的门槛也变低了,我们只需要供给数据就可以得到这个模型,这个场景下带来了第一次AI的普惠,我们看到市场上出现了大量基于AI服务的公司,并且把AI从互联网大厂带入到产业和行业中了, AI的行业落地应用开始出现。
这一次的大模型,我觉得相对于以往有一个更大的进步,那就是我们可以用一个模型解决所有问题,统一数据、统一算法、统一模型、统一任务。我不需要找几百万个例子训练模型来进行特定任务了,我用prompt直接提要求,很多任务模型就直接可以搞定了。它带来的结果是,大模型的能力实现了质的飞跃。这种能力提升的另一个好处是把AI的成本下降了两个数量级,现在只用1%的成本就可以使用AI了,所以AI也成为了最重要的生产要素之一,我们所有必需的生产要素都融合我们的生产环节里,从而给我们带来新的产品体验和新的生产模式。今天大模型在生产效率、质量上都能给我们带来帮助。
另外值得一提的是,我们也可以看到AI的进步速度之快,超出了许多人的预期。短短一年间,以ChatGPT代表的大模型给我们带来的进步非常巨大。每一次迭代都会把原来被认为只有人能完成的事情又解决了一部分,整个AI海平面在不断上升,一个一个淹没原本是人类占领的高地,不得不让我们和企业变成两栖动物,既能适应山上的生活方式,也开始适应水中的生活方式。
那么我们该如何理解大模型带来本质变化?
首先是交互能力。大模型带来底层交互能力的变化,从而推动产品体验和商业模式变化。命令行的时代的输入工具是键盘,桌面时代是鼠标,移动时代是多点触控,在AI时代则是自然语言和多模态。我们可以看到,我们输入工具承载的信息量越来越大,学习成本越来越低,效率越来越高,也越来越符合本能。
这种趋势对我们开发AI工具与产品、实现大模型商业化落地应用的过程有很大的启发,促使我们深入思考如何去更好应用诞生于这个时代的新技术、新产品。
比如说DOS时代键盘的学习成本很高,你只能用最简单的功能;而到了桌面时代出现了人利用信息的新方式,比如BBS、电脑游戏等一系列场景;而到了移动场景它又开始改变了,由于LBS能力、手机交互新的触控能力,许多新的应用诞生了。基于这个逻辑,我们相信一定会有属于AI时代的“抖音时刻”或者“ iPhone时刻”出现,我们能够看到AI Native原生产品。
在大模型落地领域,智谱AI是最早在国内做商业化的大模型公司之一。我们从三月份到现在已经累计接触超过两千家企业,共创超过两百家企业,这里面覆盖的方向非常分散,我们发现在非常多的场景里,企业已经能够落地价值并产生应用,所以大模型有没有用这件事在今天已经不需要再被讨论了,关键在于你如何快速找到你的业务和大模型的最大公约数,并且及时建立正向循环运转起来。
这对每一家想要拥抱大模型的企业都提出了要求,一方面你需要纵向来梳理自己企业核心的业务节点,另一方面你可以横向把大模型常见的能力罗列出来,这样,横纵坐标系会组成一系列的结合交叉点,作为企业你要评估这其中的场景适不适合模型能力发挥,适合哪一种模型能力,以及在我们业务当中是否足够重要。
今天我们可以看到AI从Empower(赋能)我们的产品变成AI Native原生产品的一个过渡。从最开始完全没有AI的时代,我们全部是业务功能组成的产品;到了后面开始有AI Empower了,在里面有一些单独模块由AI来应用,以至于到今天可能会出现一个独立的copilot功能,全程贯穿我们的产品;未来我们相信一定会出现完全基于AI原生的产品和商业模式,变成所谓AI Native。
基于这个背景,企业怎么规划自己的路径,我们也简单做了一点思考。
首先从上层来看,企业内部的已有的业务链条应该实现流程的信息化,确保内部大量流程都已经有数据,这是第一步。第二部,需要慢慢把这些业务的数据变成业务的数字化,让它开始有语义。能集中、及时地有效统一语义的数据是大模型利用的基础。
到了下一步,也就是决策的智能化。基于人工智能,企业内部流程的效率将得到提升,这其中包括了业务本身,包括了流程的自动化,还有一些增强分析、预测、辅助决策的能力。
我们简单把这个过程划分了几个阶段,从最开始只是简单用一用AI,到L1开始,我们开始做一些内部提效的工具,用各种各样的产品来使用AI,实现内部提效。再进一个阶段(L2),我们在业务中有一些具体模块可以被AI赋能了,用到的都是一些单点,比如智能客服、用户打标签、头像、画像等,这些不会串联主要业务,但在单点上已经帮业务带来跟以往不一样的能力。
再进一步到L3,其实我们可以用AI来重构核心业务,也就是我们的核心产品是基于AI重新设计的。比如说在医疗场景里做智能诊断、辅助诊断,或者在广告公司生成文案,以及汽车的智能驾舱,都相当于使用了AI能力重新设计了产品体验。最后一步是L4,我们希望企业能够以AI为核心,让AI成为重要战略驱动力,以此来重构整个商业模式。
我们简单抛砖引玉,和大家介绍一下在过去看到的一些场景里,大模型怎么用。
比如广告文案的生成。2021、2022年时,美国的Jasper、Copy AI都已经跑通了这个商业路径,带来几千万美金的营收。国内也有很多广告公司使用AI帮助提升广告生成的效率。
在办公领域,像WPS、NotionAI等大模型也已经开始应用。无论是会议纪要的生成,还是招聘领域里对于JD的生成,都有落地案例。
在数据分析方面,无论你做的是企服还是研究报告分析,都可以由大模型快速生成一些基础版本来辅助决策。
还有电商领域也值得一提,在中国我们的电商渠道比较分散,每个分散的渠道都有自己对应的语言、风格和习惯。如果靠人一个个去写,成本就非常高,大模型则可以极大提高文本落地的速度。
另外,信息抽取也是关键的应用。企业里经常有大量非结构化数据,这是一个未被开采的富矿。我们原来受限于技术能力,做信息抽取的成本很高。而今天大模型可以用比原来低两个数量级的成本,把非结构化数据转化为结构化数据。
比如在销售场景中,销售与客户的沟通可以借助大模型从里面快速抽取出用户的画像、用户的需求,结构化地输入到CRM。这个流程原来可能需要一个专门的技术团队花很长时间去做算法调优、标注等,而今天只需要一个Prompt工程师花上一天时间就可以搞定,效率非常高。
甚至你可以利用大模型进一步实现销售质检,和客户沟通的过程中是不是该说的话都说了?这个大模型也能够做辅助,包括一些数据的清洗标注,从评论里收集关键结构的信息等,这些智谱在商业化落地过程中都进行了探索。
另一个值得一提的领域是信息检索,我们今天所面临的信息其实是非常复杂的,数据来源非常复杂、异构,模态也是多样的,甚至还有很多噪音。这导致检索的成本比原来大了很多。而今天你完全可以借助大模型来帮你做这件事,帮你把检索回来的文档都读一遍,再直接针对你的问题做回答。甚至你可以用自然语言的方式追问,比如提供一份70页合同,你问哪些条款会导致合同失效,大模型可以马上给出答案。这种能力甚至包括了视频,我们原来检索视频只能检索出来标题和封面,而大模型可以把所有文字字幕阅读出来,整理成内容给你反馈。
许多大型的项目,其信息是非常分散,难以整体观察的,大模型因此可以变成你的顾问,帮你快速解答。这是对智能对话的全新升级,手机端的语音助手,包括各种游戏、虚拟社交、情感、汽车智能驾舱,都可以被大模型赋能。
还有一些针对代码的应用,一方面我们有代码类模型可以直接辅助程序员提高写代码效率,直接建网站。另外还有NL2SQL,直接转成SQL语句,帮你查询自己的数据,相当于给每一个销售、每一个运营都配置一个独立的分析师,来提高效率。大模型可以极大提升生产效率和降低维护的成本。
实际上还有非常多不同的场景,其实是在被大模型赋能,我们也随着和客户的合作,不断拓展大模型的边界,我们觉得能解决的问题还有非常多。
最后,我简单和大家介绍一下我们所理解的大模型落地的实践路线,不敢说“最佳”,所以加了一个引号,在今天依然还是很早期,只是我们在这里一些实践的想法,供大家参考。
这里包括了两个维度:首先要考虑企业是不是大模型ready了,你要先了解自己的企业,再了解大模型。了解企业这一端,首先我们对大模型要有一个合理的期待,我们发现很多企业会把大模型当成一个许愿池,希望它能解决一切问题,任何问题丢给它,它都能解决,现实当中是做不到的,它只是一种技术的能力。所有企业在接入大模型之前先要自己内部做审视,我们的数字化程度是否充足,所有业务数据是否都在里面,有没有这样的数据支撑我们去做AI化;是否明确找到一个能够落地的场景,这个场景是大模型所擅长的,且是业务的痛点;我们是否有一个明确可衡量的指标,确保它能测试;我们能否有一个全职负责人追踪这件事,把它落下来。以及最后我们需要在里面有一个合理的期待,既不要短期的高估大模型的能力,也不要长期低估它的潜力。以大模型今天迭代的速度,我们建立一个自己的路线,一步一步,每一次形成一个精密的闭环,让我们不断看到它的价值,再逐步地前行,到最后让我们能够完全建立一个基于大模型企业的竞争力。
第二个维度是从模型侧出发。大模型获取知识的方式只有三种,预训练,相当于通用能力;微调,相当于领域能力;Prompt,相当于任务能力。这就要求企业主知道企业内部数据和竞争力该如何分解,哪一部分以哪种方式进入大模型,而不是把所有的东西混合到一起。这不是一个所谓简单的“大力出奇迹”的过程,并不是数据越多,模型效果越好,正确地拆解,合理的分布非常很重要,这要求企业既深入理解自己的组织,又理解大模型。
当你在上述两个维度做好了充分准备猴,下面你要做的就是选择一个好的基座模型了。在国内市场,一个好的基座模型意味着它能够稳定、长期持续的更新,有足够丰富的产品能够满足你的业务,并且还有很好的合规和支持服务能力。
最后,围绕着大模型,我们需要构建一个基于AI的组织架构,这个方面我们并不是专家,但总的来说这个组织内应该包括prompt工程师、数据工程师、微调工程师, 以及专门的负责大模型业务的BP,像布道者一样把大模型能力深入到业务的各个环节中去。
企业最终的目标,应该是让所有这些环节形成一个正循环,这个循环是一方面能够源源不断产生新的大模型时代的数据资产,构成我们的壁垒和竞争力,另一方面这些资产又能够灌回模型当中,变成我们自己的业务价值,把它耦合到业务场景当中去。如何实现这个正循环,是今天每一个拥抱大模型的企业都应该去深入思考的问题。