每经专访第四范式董事长戴文渊:澄清AI热潮背后的误解,向“无穷大”前进
每经记者:可 杨 每经编辑:张海妮
由史蒂文·斯皮尔伯格(Steven Spielberg)执导的电影《人工智能》,讲述的是一个小男孩最终发现自己是人工智能的故事。
人工智能什么时候才能达到这样的水平?难道人工智能的作用就是制造一个类人智能体吗?这是第四范式创始人、董事长戴文渊投身人工智能产业早期最令他迷惑的两个问题。
最终,他在图灵奖获得者詹姆斯·尼古拉·格雷(James Nicholas Gray,昵 称 Jim Gray)2007年《科学发展的四个范式》的演讲中找到答案。其中,第四范式阶段是指数据科学——随着数据爆发式增长以及技术演进,科学理论由计算机从海量数据中发现。
视觉中国
戴文渊所创立的人工智能公司“第四范式”的名字也由此而来。这家成立于2014年的企业级人工智能平台企业,迎着人工智能的潮起与潮落成长至今,作为掌舵者,戴文渊向《每日经济新闻》记者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因为这对于市场来说也不重要,客户关心的问题是:“我是卖鸡翅的,AI能做的所有的事情,跟我有什么关系?重要的是我的鸡翅能不能(通过AI)卖得更好。”
大模型时代,第四范式主张对模型进行“剪裁”,以求用最“经济”的方式做领先的AI。在戴文渊眼中,通用大模型和行业大模型是实现AGI(通用人工智能)的不同路径,区别在于是用一个模型去实现AGI,还是用很多模型去实现AGI。而两相比较之下,行业大模型是他认为最经济的方式。
热潮与误解一同翻涌,市场期望AI解决所有问题
新的热浪翻涌在第四范式成立的第十年,这也促使戴文渊作出了一些改变。
2023年,很多人找到戴文渊,问他:“ChatGPT会怎么帮助到我的企业?”上一次他被问及类似的问题是在2016年,那时,问句的主语是AlphaGO。
更有趣的是,这一次,几乎所有的客户、投资人、媒体记者都在使用“技术的语言”来提问,“参数”成为高频词,与之前的状况大不相同。
戴文渊说:“要把AI做好,就先不要谈AI的问题,先谈谈公司是做什么的,把这些问题谈清楚,咱们再回头看看AI是不是可以(对公司)有帮助。”
市场和客户都对新技术感到兴奋时,戴文渊希望能借此机会引导一个正确的“AI价值观”:“不能先把参数做到一千亿,再想这千亿的参数到底能干什么?”
市场期望AI解决所有的问题,这反映了一种恐慌心理:万一 AI能做但是自己没有用到,那可能会失去一些机会。戴文渊将此视为一个机遇,“担忧”打开了世人想要了解AI的窗子,但误解也同热潮一同翻涌,第四范式要做的,是把AI的价值带到众人面前。
ChatGPT,这个目前最火爆的大模型应用,将大模型带到了人工智能圈层以外的世界。热浪之下,一些人对于大模型的理解或许是:和ChatGPT一样的技术。
直至今天,市场中最受关注的大模型依旧是以大语言模型为主,即“预测下一个字”的模型,年初爆火的Sora则是“预测下一帧画面”的模型。
但应用是更加实际的事,对于绝大多数企业而言,“预测下一个字”解决不了核心问题。例如,金融机构需要解决风控问题,但这不是语言问题;大语言模型可能会辅助金融机构解决客服事宜,但这可能不是它的核心问题。真正的行业大模型应当是针对不同场景,构建不同模态,去预测下一个“事情”。
这背后有一个更大的误解——很多人问,能不能基于开源大模型底座或GPT,训练行业需要的新模态模型。但即使同样出自OpenAI之手,要在GPT模型上直接精调出Sora,也是不可能的事情。
戴文渊介绍,大多数行业大模型是要基于特定业务所积累的特定模态的数据,训练出一个基座大模型,就像目前训练底座的大语言模型、视频模型一样。
行业大模型这件事,其实已经发生了十年之久。2014年,第四范式推出人工智能平台——先知1.0,用建模型的方式,挖掘业务数据价值,提升业务效果。如今“先知”已经迭代到了5.0版本,定位于降门槛,让企业自行构建高价值场景所需的行业大模型,例如预测疾病风险、欺诈行为、灾害险情、设备故障等,打破大语言模型只能生成文字、图像、视频的局限。
信心不再是问题,但市场的耐心有限
1956年夏天,在达特茅斯学院举办了一场人工智能研讨会,主题是研究“让机器能像人那样认知、思考和学习,即用计算机模拟人的智能”。这次会议被普遍视为人工智能技术的起点。由此出发,人工智能开始沿着一条波浪式的曲线前进,经历着巨大的潮起与潮落,穿梭在失望与希望之间。
两到三年,戴文渊认为这是市场能给一场技术热潮的最大耐心。
距离我们最近的一次潮起被认为来自2016年,基于强化学习算法的AlphaGo战胜人类围棋选手李世石,“机器是否会代替人类”在彼时引发市场关注,商汤科技、旷视科技等一批人工智能“独角兽”站到台前。
第四范式是一家幸运的公司,这家公司诞生于2014年,从诞生的第一天就开始做企业端的生意。不过那时候,很多企业告诉戴文渊,他们没有人工智能预算。随着AlphaGO成为那枚投向平静水面的石子,突然之间,所有客户都来问他:“你们是人工智能企业,你来给我讲一讲AlphaGO可以帮我做什么?”“我们有预算,我们要AlphaGO。”
两三年的时间,人们理想中的人工智能工具没有诞生,市场信心在2019年崩盘。据猎豹全球智库数据,与2018年相比,2019年中国人工智能企业的融资金额由1484.53亿元下降至967.27亿元,下降幅度达到34.8%,融资数量也由737个下降至431个,下降幅度达四成。
直到ChatGPT成为下一颗石子,这场“寒冬”结束,AI市场再度迎来热潮。
戴文渊认为,在2023年以前,市场对AI是信心问题。从2023年开始,不再是信心问题,而是要找到正确路径的问题。“不用担心客户认为AI没有用,需要解决的是,引导客户反过来想业务的问题。”戴文渊说。
潮起潮落,似乎已经成为人工智能行业的常态。潮为什么落,戴文渊认为和价值相关。2016年,每家企业都陷入“怎么去用AlphaGO帮助到我”的问题中,这个潮落了。今天也一样,如果每家企业想的都是“怎么用ChatGPT帮助到我”,可能这个潮也会落。
戴文渊判断,两三年内,如果大模型不能创造出巨大的价值,可能就会再度潮落,等待下一颗“石子”——或许是一个新的能够吸引眼球的东西,或许是能够在合理的投入产出中创造出足够价值的技术。
当下的机遇是市场的目光重新被吸引,但挑战在于,两到三年内能否兑现大模型的价值?
市场关注到人工智能“+”,戴文渊认为这个加号非常重要,这意味着,未来两到三年,人工智能有可能创造出很大的价值,如果大家想的都是ChatGPT能不能帮到企业,不见得能创造市场预期的价值。
“以语言模型为例,去年主要的落地场景都与客服相关,如果在这么大的关注度之下,落地的应用全是问答类场景,可能两三年以后大家就失望了。”他说。
AI是一个实验的过程,目标是提升“北极星指标”
目前来看,大模型赋能行业,依旧是一个充满前景的故事,因为理论上不存在大模型无法赋能的行业,人效上可以充分发挥想象力。
目前,绝大多数企业的核心业务都由人来作决策,但人作决策时往往面临两个困境:水平参差不齐、精力有限。当AI能力提升,哪怕其能力尚未全面超越人类,即便仅达到人类的平均水平,但如果能复制很多“人”,就很有可能提供更好的业务价值。
企业招聘员工时,并非需要每个员工都达到顶尖水平,而是注重每个员工是否能为企业带来积极的贡献。因此,戴文渊认为,尽管第四范式的目标是使AI的表现超越绝大多数业务专家,但从实践角度来看,AI即使仅仅达到专家平均的能力水平,也有可能为企业带来显著的价值提升。
从数字化时代开启到数智化时代来临,赋能传统企业与实体经济始终是市场对技术的期待。随着大模型来临,数字技术从传统的信息搜集、传输、整理、储存,逐渐走到辅助决策甚至替代决策阶段。
戴文渊指出,一些企业当前在使用AI时,依旧存在数字化时代的惯性思维,即过于依赖同行业的成功案例,试图直接移植成熟方案落地到本企业。但实际上AI和企业核心竞争力相关以后,不同企业的目标是不一样的。
理想状态下,大模型应该能够帮助企业完成核心决策。为此,第四范式将企业的战略目标转化为计算机可以记录和跟踪的语言,即企业的“北极星指标”,以此作为企业最核心的关键指标。
戴文渊认为,对于企业而言,在使用AI前,需要先想明白一点:对于提升“北极星指标”,什么叫好,什么叫不好。以实体零售企业为例,其核心效率体现在每平方米所贡献的效益上,这可能就是一家零售企业的“北极星指标”。所有围绕这一指标的改进,都需要量化其对“北极星指标”的实际影响,无论是提升还是下降。
在实践中,AI的应用并不意味着每一步都能带来提升。
“AI其实是一个实验的过程。”戴文渊举例,假设有一百万的客户基础,可能将九十万作为基线,剩余的十万,每一万作为一个实验组,持续尝试模型的优化与迭代。“早期的实验基本上是成功的,每次实验都会比‘九十万’更好。但是到了一定阶段绝大多数的实验都是失败的,也没有关系,往往到了一定的规模体量以后,一百次体验如果能成功一次,就能赚回前面九十九次失败的所有成本。”戴文渊说。
AI是一个实验的过程,这是戴文渊的认知,但尚未在客户中达成共识。
客户的认知提升是AI产业发展至关重要的一环。如果认知迟迟没有发生变化,AI会重新变成“需要有一个大模型、交付一个大模型,这个大模型的参数是不是1000亿,是1000亿就验收通过付款、结束”的过程,也许再经过一年半载,客户会觉得,大模型好像没什么用。
这时,热潮可能将会再度遗憾告终。
AI是科学问题,AI应用是经济问题
在通往AGI的路上,通用大模型和行业大模型是两条不同的技术路线。戴文渊认为,大家都是朝着AGI的方向前进,区别在于是用一个模型去实现AGI,还是用很多模型去实现AGI。
在他看来,用一个模型去解决所有的问题,不是最经济的。
戴文渊还提出了一个更为少见的观点:并不存在真正的通用大模型,所谓的通用大模型,本质是将多种场景融入一个模型中。
第四范式的做法是,进行剪裁,先做垂直的行业模型。如果模型仅针对某一特定场景进行应用,就先通过该场景的数据模态构建专用模型,同样参数量往往能实现更好的效果。相反,若模型被设计为一个通用大型模型,最后通用大模型应用到某一具体场景,往往很可能是不经济的。
“经济”,在一个小时的采访里,戴文渊至少5次提到这个词。“我们致力于把这个问题(解决),或者把这个技术做出来,如果我选择了不经济的一条路,可能最后我会做不出来,我们要综合考虑每一种方向,每一个路线所面临的问题,最后找到一个最有可能的解决方法。”戴文渊说。
“做最领先的AI是特别贵的事,需要花很多钱。”或许正因为如此,在技术信仰派和商业信仰派之争中,戴文渊认为自己处于两者之间。
AI显然是个科学问题,但做出最领先的AI技术,是个需要计算的经济问题。
戴文渊认为,经营一家AI技术公司,需要站在商业的角度思考问题:最领先的AI技术需要海量的算力和数据,如果不能和商业更好(地)结合,那么长期持续的资金投入将变得难以为继,既需要技术又需要商业,如果你要做最好的东西,就必须要都有。
此外,对于AI从业者的自我修养,戴文渊认为,还需要具备韧劲与恒心,“人工智能就是一个起起伏伏的赛道,可能这两年又被大家关注到了,甚至被吹上天,被吹上天的时候你不要觉得自己是神仙。同时,被踩到地下的时候,也不要觉得自己没有价值”。
波浪式前进的过程中,可以肯定的是,通往AGI的道路并没有一个标准的指路牌。
“AGI是我们所有人的理想,AGI就是我自己心目当中的一个无穷大。”戴文渊从来不认为AGI是一件三年、五年甚至十年就能实现的事,相反,他觉得,AGI是一件永远做不到,但永远都在做的事。