大变革已来,数据驱动,金融数据与模型深度融合

财联社10月24日讯(记者 李翀)随着大模型时代来临,数据要素的变革在深刻影响金融业务生态的发展。10月18日,在“全球资产管理中心 上海国际活动周2024”第五届1024资管科技开发者大会(ITDC2024)上,多位业内人士就大模型技术赋能金融数据业务创新发展接受了财联社的采访。

大模型技术助力数据要素的变革

数据作为新时代信息革命的“石油”,其重要性不言而喻。

天云数据CEO雷涛接受财联社采访时表示,关于大模型与数据之间的关系,核心在存量数据和增量数据。关于存量数据,核心需要关注的技术是大模型to DB,去解决如何跟上万张表且高价值密度的企业数据库的数据发生关系;关于增量数据,去解决如何持续的供给大模型以及大模型真正的算力出口在哪里,是提供服务还是提供新兴的生产资料。供给我们更多的数据资源,也就是合成数据的概念。

“大模型需要连接价值密度高、逻辑性强、动态且鲜活的数据,这些数据都跟生产经营的交易相关,比如股票信息、金融账户、医院里挂号信息”,雷涛表示,这些数据都不在静态的文档、文献或报告里,而是在数据库里。但是目前大模型所依赖的数据资源局限于静态文献中的知识,这在一定程度上限制了其对于高价值数据的全面获取,尤其是那些存储在客户私域中的宝贵数据。

在雷涛看来,“目前普遍采用的RAG技术将信息检索和生成两个阶段结合起来,通过检索数据库中的相关信息来辅助生成过程,解决大模型数据滞后带来的幻觉问题,提高生成内容的质量”,作为侧重于构建高效的交易系统,利用先进的人工智能技术来提升交易效率和准确性的数据服务商,天云数据在实践中也探索了如何将大模型与金融应用场景相结合。

“服务于券商的数字人,播报的内容是来自于实时交易系统的数据和研报文本内容的结合。针对这样的场景,就需要把大模型的模糊意图匹配和精确的SQL操作形成连接。这种连接不是一对一的,面涉及到非常复杂的工程技术”, 雷涛表示。

烯牛数据CEO李锦香接受财联社采访时也表示,大模型在处理具体业务时往往需要与现有的系统和服务进行集成,“这是一项具有挑战性的任务,目前烯牛数据主营业务核心还是做垂直领域的数据加工”,李锦香表示,作为专注于在股权投资领域提供专业的金融数据服务商,烯牛数据的客户群体也逐渐从VC投资机构扩展至银行、券商等各类金融机构,并且还包括政府引导基金。

此外,上海特高信息技术有限公司创始人兼CEO崔建军向财联社记者表示,区块链技术因其脱媒介、防篡改及可追溯等技术特性,被称为互联网上的“信任机器”,与证券行业天然契合。“区块链技术解决了证券行业的数据可信、隐私保护、多方协同以及健全数据标准等痛点,也为证券数据防伪和存证、信息跨地域跨机构共享以及行业数字化转型打开了想象空间。”

大模型技术赋能金融行业的发展

随着人工智能技术的快速发展,特别是大模型的出现,以其强大的数据处理能力和广泛的应用场景,大模型正在逐渐改变金融行业的运作方式。

“比如大模型带来的多态视觉与空间计算能力的大幅提升,使得金融服务能够更加直观、生动地呈现给用户”,雷涛表示,“现在互联网每天约80%的流量来自视频,在这么多视频碎片里,大模型架构可以对视觉做直接管理,能够自动提取视频的关键信息,将长达一个小时的采访压缩成几分钟的核心摘要,实现视觉和语言的统一”。

此外在生成数字人内容方面,天云数据也可以实现通过大模型技术,将精准的金融数据表达与宏观分析相结合,创造出更具吸引力的营销材料。

与此同时,李锦香表示,随着大模型技术的进步,尤其是在金融领域,数据的质量和准确性变得愈发重要。“这不仅要有强大的数据处理能力,还需要具备将数据转化为实际价值,应用于具体的业务场景的能力”。

“这也是目前烯牛数据打造核心竞争力的所在,烯牛数据也在通过对企业的细致标签化处理,结合行业研究及资本动态,引入大模型技术为用户提供更为深入的企业画像”,李锦香对财联社表示,此外大模型技术高效的数据处理能力带来了金融领域更加智能化的产品形态,烯牛数据也可以实现比如通过对话式的交互方式获取关于特定企业或行业的详尽分析报告的能力。

值得注意的是,尽管大模型带来了诸多便利,但在实际应用过程中仍存在一些问题。例如,如何确保模型的理解能力和记忆功能,使其能够在处理复杂问题时保持准确性和一致性;如何通过不断的学习和优化来提高模型的表现;以及如何在模型中融入人类的专业知识和经验,使其更加贴近实际业务需求等。

受访人士均表示,金融行业人工智能化应用场景丰富,随着国家对科技金融的重视程度不断提升,国内科技公司也在积极拥抱大模型技术所带来的机遇,提升数据处理能力,改善用户体验,为实现金融行业智能化转型贡献自己的力量。