马上消金CTO蒋宁:金融大模型向智能体、轻量化、全价值链创新演进
在大模型火爆的两年内,马上消费金融正在实践中不断通过 “小步快跑”,以实现金融大模型的快速演进。
11月28日,在重庆举办的数字生态伙伴创新大会上,马上消费金融CTO蒋宁在接受采访时表示,经过两年多以来的探索实践,对大模型的认识更加深刻,原本业界普遍认为大模型必须满足巨大的参数,有着高昂训练成本,然而实践得出的结论却并非如此。
他表示,金融大模型可以实现“轻量化应用”,在降低成本与提高效率之间寻求最优解,也可以将金融大模型从单场景创新演进成为零售金融全价值链大模型,乃至应用于更广泛社会生活的领域;最后,金融大模型正在演进成为“智能体”,推理能力而非数据训练,将成为大模型具备的更重要的能力。
金融大模型“溢出效应”
蒋宁表示,1.0版本的天镜大模型还只是一个局部的创新,是由场景驱动的,主要训练了人机交互来解决金融客服、营销等场景的应用。当时是基于2亿用户,训练了约100P数据,实现了100亿的交易额。
他称,但在1.0以后,一直在思考在金融这个长价值链的产业中,大模型是否能在包括营销、风控、消费者权益保护,甚至客户体验、合规等场景进行应用,因此做了深度探索。
蒋宁表示,例如,在反金融黑灰产领域,马上消金应用了多项大模型技术来进行高效反黑。可以在贷款人允许下记录声纹,如果后续交互过程中,发现他的声音发生变化的时候,就有理由怀疑,这可能不是他本人的意思表达从而识别黑灰产。此外,整合多模态大模型还可以识别借款人的周边的环境、地址、网络地址等,再结合复杂网络技术,隐私计算技术,多种技术结合,就形成了打击黑产的科技能力。
除了金融领域,马上消费人工智能研究院院长陆全也表示,马上消金也把在金融领域积累的能力又反哺到国家重大项目里,通过参与社会生态建设,让人工智能团队的知识、经验能在更广泛的领域得到锻炼提升机会。
马上消费人工智能研究院邓伟洪也表示,目前,公司在养老机器人上做了比较大的投入,可以满足老年人在社交、康养方面的需求。他表示,养老机器人未来应用场景丰富,一是社交陪伴场景,可以做一个数字人跟老年人进行心理疏导。二是游戏娱乐场景,可以给老人开发认知小游戏,锻炼他们的认知功能,也可以给他们放一些好看的电影。三是安全观察场景,老年人摔倒是一个很大的风险,可以做一些监护。四是未来当机器人可以做到自由运动,可以给老人做一些家务,给老人送药。
从单体大模型到“智能体”
在采访中,马上消费金融人工智能研究院院长陆全表示,在过去两年的金融大模型实践过程中,第一个发现就是光靠单一、单体基础大模型,或者说单体大模型不能适应产业界绝大多数应用,因此,马上的天镜从单体大模型,也逐渐变成了目前的“逻辑”与“记忆”分离的“智能体”。
陆全表示,所谓“智能体”,其背后包括了多个大模型和小模型,通过把这些模型组合在一起,多个模型之间互相协作,来完成一连串的复杂任务。
他表示,发现金融多个领域的应用都需要多智能体系统来处理,这是因为单体大模型能力相当有限,就像一个人不可能是文科状元,还是理科状元,还懂管理。而在智能体情况下,大模型就可以相互配合,把逻辑和数据分析分离,让大模型做专业上最擅长的事情。
陆全称,这意味着,智能体在某些价值链上天然就具备泛化能力,可以移植到类似场景,比如防伪,可能所有场景的要求是一致的。当智能体掌握了某个逻辑,且在业务形态比较接近的情况下,就会更具备泛化应用的能力。
高成本到“轻量化”
蒋宁表示,在实践中,对大模型的认知也在逐步深入。在天镜大模型1.0时代,普遍认为需要建设一个高成本、参数巨大的大模型来训练,才能让模型能够发挥效力。然而,当大模型应用从单场景向全价值链演进,就发现可能有些场景参数没有那么大的时候,也可以保证在很短时间内可以得出正确答案,而有些场景非常注重严密的逻辑,就可能需要更大的参数。因此,2.0版本的天镜大模型正在向更轻量,更小型化发展,根据不同场景选择能够起效的最小参数,来实现对成本的有效地控制。
他还表示,此前,大模型创新成本比较贵,一张算力卡初始阶段只能支持50个机器人和人的交互,而现在通过大模型各种调优技术轻量化,一张同样的卡可以支持10倍以上的交互。
陆全也表示,过去大家一直把更多的算力都关注在基础大模型的训练上,而现在,马上消费金融的大模型绝大部分算力都消耗在推理上,其次才是消耗在持续训练上。目前,一些基础开源大模型发展得很快,金融垂类模型只需要在它的基础上做微调就可以快速吃到红利;另一方面,是发现在实际过程中,并没有那么大的必要来做基础模型的精益求精。
陆全表示,目前,公司的金融大模型天镜在销售上已经为公司带来了盈利,而且还在探索建立一套商业模式。目前,天镜大模型正在通过“小步快跑”,不断证明自身的盈利能力。