蚂蚁集团续兴中:保险科技新范式是领域大模型跟专业小模型的协同智能
来源:睿见Economy
2024年服贸会专题活动之一——“第六届中国金融科技论坛”9月12日-13日在北京举行,主题为:科技赋能——金融业数字化转型与应用。蚂蚁集团保险智能科技部总经理续兴中出席并演讲。
续兴中认为,大模型技术很好地解决了,知识、逻辑推理和表达三方面的挑战,让高质量的保险服务普惠成为了一种可能。
他表示,保险行业在大模型时代确实需要一个严谨可靠的领域大模型,但大模型并不是全部,并不是对过往积累的很多小模型专业工具的替代,需要的是大小模型能够一起工作的范式。
他指出,保险科技新范式是领域大模型跟专业小模型的协同智能。
以下为演讲实录:
各位来宾,大家上午好,我是来自蚂蚁集团保险智能科技部的续兴中,很荣幸能够有机会向各位领导汇报蚂蚁集团保险科技在大模型时代的一些心得和体会。
蚂蚁保是蚂蚁集团旗下的保险代理平台。科技一直是我们平台的核心基因, AI伴随着我们的业务共同成长。 我们把蚂蚁保的业务大致分成三个阶段:前两个阶段平台后推出了好医保、全民保等普惠爆款产品,并围绕这些产品建立了相应的风控、营销、理赔等关键平台服务能力。我们在技术上将这一时期,定义为前大模型时代。其主要的工作是以判别式AI模型和优化模型为主,针对具体的我们定义的一百多个业务子场景,持续迭代优化。过程中我们累积了500多个AI模型,帮助业务取得了显著的降本增效成果。2023年以来,大模型横空出世,让我们的平台进入了3.0智能时代。相比于上一个时代,我们这一波技术革命带来的最大变革,是从降本增效型的工作转移到了新的服务和新的质量。2C端我们借助于对话式AI向客户提供媲美专家的智能保险服务。在2P层面,我们面向公司内外的各个业务专家提供了相应的智能业务解决方案。
我们知道保险行业并不缺乏服务营销人员,但为什么感觉高质量的保险服务非常稀缺呢?我们自己总结了三个原因:一是说保险行业本身是一个知识相对密集的行业,包含了大量医学知识、保险知识和金融知识。以我们蚂蚁保自身为例,为了做核赔理赔,仅我们内部的知识图谱就累积了七千多种不同的疾病,这么大量的知识光靠人,甚至是医生,也是没办法学会和掌握的。二是保险服务本身是一个重决策,和流程相对复杂的行业,比如我们要对客户进行风险的分析,对它的财务或者健康状况进行相应的保险配置,甚至是针对某一个具体的保险合同做核保、核赔相关的咨询,这均需要专家的知识和推理。三是服务沟通的挑战。保险的售卖流程相对较长,好的保险服务,往往需要长时间、多轮数的反复沟通,过程之中不仅仅要体现出专业价值还要体现出情绪价值。
我们认为大模型技术很好的解决了,知识、逻辑推理和表达三方面的挑战,让高质量的保险服务普惠成为了一种可能。
但这并不是说我们把通用大模型直接应用到保险金融行业就可以了,我们的实践中,抽象了三种挑战。一是领域知识的挑战。对于保险条款的具体问题,如果我们直接问通用大模型。通用大模型往往泛泛而谈。在这个例子上,说了很多,最后还是建议客户查阅保险相关的合同,没有直接明确的解决客户的问题。第二个是安全合规上的挑战。保险行业是一个非常注重合规的行业。在这个例子里面,通用大模型将寿险定义成了一种理财产品,如果我们直接使用这样的回答,会对我们的经营产生不必要的合规风险。第三个是专业技能上的挑战。保险并不是一个只需要说的行业,实际上在整个流程之中有很多专业的任务与服务。以理赔为例,客户会上交很多材料,比如在这个例子是住院记录的材料,我们需要对这个材料进行相应的识别、提取跟推理。即使我们使用现在最先进的多模态大模型,6个提取的任务错了3个,这是远远没办法满足我们自动化理赔要求的。但事实上在小模型阶段,如果使用OCR模型,就可以很好的解决这类问题。
总结一下,保险行业确实在大模型时代需要一个严谨可靠的领域大模型。同时我们也注意到大模型也并不是全部,并不是对过往我们积累的很多小模型专业工具的替代,我们需要的是大小模型能够一起工作的范式。
首先解决第一点,蚂蚁集团自身经验表明如何为保险行业两定制一款严谨可靠的大模型。我们重点有两方面的增强。一个是领域知识的增强,在持续训练阶段和对齐阶段我们分别引入了百亿Tokens的保险、医学相应的知识,自身沉淀和准备了500万条精标的指令数据。另一方面是安全可靠的增强,我们准备了200万条金融价值观对齐的指令集,长期维护了300人以上的专家标注队伍,持续对我们的训练数据、模型的表现进行安全合规跟对抗方面的标注。基于这两方面的努力,我们的领域大模型-凤凰大模型,相比于通用大模型,在保险专业、安全和合规等多个方面,有显著的增强。
再一个问题,保险行业累积了大量的小模型和工具,如何将大模型,跟这些相应的工具和小模型能够协同起来。蚂蚁的经验是使用多智能体的协同框架。我们自身也开源了这样的一个框架叫Agent Universe,本质上是教会大模型在合适的时候, 使用合适的工具或者调用相应的模型。举个例子,还是以理赔为例,客户上传一张发票,大模型需要正确识别这是一张发票,然后调用相应的提取模型或者工具,如果说面有二维码,相应的识别这个二维码并且访问它,最后对整体这张发票进行反欺诈的模型检验,这样才能完成一个典型的复杂专业任务。
我们认为保险科技新范式是领域大模型跟专业小模型的协同智能。针对这个新的范式,蚂蚁保全面升级了保险的新服务,在2C端发布了蚂小财的智能保险和理财助理。2P层面我们针对保险各个环节,比如客户服务营销等环节,面向业务专家提供相应的智能解决方案。
首先简单介绍一下蚂小财。上周正好在外滩大会做了整体的升级,包括模型层面和品牌层面。 大家可以通过支付宝的蚂蚁保直接就使用智能对话助理。这个例子表明,当用户对一些具体的条款和自身的情况进行询问的时候,我们的蚂小财能够实时准确的回答用户的问题,并适时的推出相应的售卖推荐服务。事实上蚂小财已经覆盖了客户的全生命周期,包括选配和投赔等多个不同环节,全网一千多个保险产品和内部的60多个工具,累积服务了4800万用户。在模型的表现方面,在保险通识问答准确率上,我们达到了92%的准确率,对于更加专业和严谨的两核:核赔和核保类问题,我们进一步优化,达到了95% 以上的准确率。
第二是业务增长层面,AI一直以来,不管是在小模型还是大模型时期,对于保险的业务增长均非常关键。在营销方面, 我们率先落地了多模态大模型在创意和文案生成方面的工作,再结合小模型比较擅长的个性化推荐,我们整体为业务带来了10%+的年均复利增长。在服务层面,上周我们向保险行业推出了AI+人工的服务解决方案, 其背后也是大小模型的协同框架。比如在售前,我们的小模型会对客户进行分析,提供相应的智能线索。售中我们使用大模型的对话理解,适时的推荐销售话术,事后对整体的对话进行质检和复盘。三者叠加,我们AI加持下的人工坐席其服务半径相比传统方式有3-5倍的提升。
相比于业务增长,我们认为保险行业稳健经营更加重要。
风控层面,我们以小模型为主,再加上运筹优化,覆盖了保险产品的全链路,从产品定价到精算、核保审核、理赔的案件调整等。相比于行业来,我们在赔付率和减损方面有10%以上的优势。
合规层面是我们今年新增的大模型实践。大模型本身比较适合长文本的理解和多模态的理解, 而合规往往需要对大段条款进行理解,对不同的合规审核点进行逐一校验,我们认为这样的场景比较适合大模型。我们的合规智能体, 对我们平台上售卖这些产品的销售页面,跟它对应的条款进行逐一、逐条的合规校验。通过这种方式让我们在经营之中发现所有的合规隐患。现在合规智能体,已经覆盖了全平台大概一千多款产品,平均每一款产品都要有200多个智能合规的校验点。
最后讲一下理赔,理赔是客户对于保险感受最深的一个服务点,一直以来也是蚂蚁保险科技投入的重点。过去依赖小模型,我们推出了安心赔的服务,当用户提交了理赔申请之后我们承诺2日赔付。 在新的范式加持之下。我们突破了两个难点:一个是高精度的信息提取,我们达到了99%的准确率,这个依赖于多模态大模型跟整体生成式提取的技术进步。再一块是专家级的理赔审核,我们知道理赔是个多步思考过程,我们同审核专家进行步骤对齐,在审核步骤的准确率上达到了98%的准确率。两者叠加,再加上过去我们在小模型和自动化理赔链路的积累,使得规模化和端到端的秒级赔付成为可能。上个月底,我们跟合作的保司进行秒赔服务的品牌上线,大概82%门诊险客户、51%的住院险,已经获得了秒赔的服务体验。
最后,新的科技范式在大模型时代才刚刚开始,蚂蚁保希望携手各个行业伙伴,一起构筑保险科技的新服务,谢谢大家。