金融大模型应用面临三大挑战,联邦学习如何破题?

21世纪经济报道见习记者程维妙 北京报道

近年银行频频提到要以“科技赋能”提高效率,另一边,AI(人工智能)、联邦学习、大模型等热门技术名词不断更迭,对公众来说还比较抽象。银行运用了什么技术、用到哪些环节和场景上?很多人也普遍搞不清其中的关联。

“近年来,以大模型为代表的AI技术进入发展快车道,具备数字化程度高、商业化应用场景潜在价值高等优势的金融业,是AI大模型落地应用的最佳场景之一。”7月2日,在以“大模型时代AI前沿与金融应用”为主题的微众媒体学院会议上,与会专家说道。

银行的营销、风控等环节是大模型应用的重要场景,不过目前在发展应用中显现三大挑战。

与会专家表示,一是从算力角度,大模型的训练过程中需要庞大的硬件算力资源支撑,大模型参数规模呈持续扩张趋势,对算力提出了更高要求;二是从算法角度,大模型生成内容可能存在安全风险,同时广泛存在隐形偏见的可能性;三是从数据角度,近年来各项法律法规对私域数据的使用有“数据可用不可见”的要求,在医疗、金融等行业都存在海量自治的高质量数据,但受限于隐私无法共享利用。

围绕其中提到的算力提速,此前也曾有机构人士举例称,假设一家银行某地分行每天要给5000个存量用户打电话进行营销,每个用户有2000个标签,提高营销转化率就需要算力。但算力提升也是比较难攻克的一个点,假设一个明文数据是一个bit,为了不让数据泄露,同时能够算出其中的内容,隐私计算就要把它变成1000个bit。没有增加任何信息,但负载变得非常大。

怎样解决大模型应用落地的技术难题?微众银行人工智能首席科学家范力欣提到联邦学习。他表示,联邦学习作为一种先进的分布式机器学习范式,允许参与方在不直接共享原始数据的情况下协作训练模型,为解决大模型应用落地的技术难题提供了创新路径。

联邦学习是隐私计算的关键技术之一,它的一个特征就是“数据可用不可见”,可以防止数据在流转过程中泄露。业界广为流传一个“羊吃草”的比喻,假设模型是一只羊,这只羊吃的草料(即数据)来自不同提供者,提供者之间不想被对方知道自己的草料是如何生产的,羊可以从一个草场到另一个草场,而草料不出本地。

“联邦大模型技术路线通过其独特的设计,不仅解决了数据时效性、模型幻觉、专业知识融合及算力资源消耗等挑战,而且在保护数据隐私和促进AI技术公平性方面迈出了重要一步,为大模型在各领域的广泛应用开辟了新的可能。”范力欣表示。