蚂蚁造“盾”的“二八定律”

作者 | 金旺

2018年,P2P产业暴雷,行业失序。

这一年,各地面临最大的问题是:当地到底有多少家企业在从事非法金融活动,这些企业又存在怎样的风险?

由此一并受到社会高度关注的,还有风控行业。

当时在蚂蚁集团做C类风控的一支团队,面对如此汹涌的行业大潮,也开始思考其中问题,着手构建商业信用视角的企业风险大脑。

当时的企业风险大脑主要在做两件事:全网的舆情监控、全网企业信息识别。

“当时我们已经能够通过全网信息理解一家企业在做什么,判断出他们是否在从事非法金融活动,”回忆起团队在2019年构建的企业风险大脑,蚂蚁数科安全科技技术总监章鹏如是说。

企业风险大脑,也成了蚂蚁蚁盾后来进一步进入产业风控领域的开端。

四年后的今天,蚁盾已经进入到金融、出行、大宗贸易等十数个行业2000余家企业,开始作为copilot,辅助企业进行风险评估和拓客决策。

01 蚁盾“入仕”三部曲

2019年,蚂蚁蚁盾搭建的企业风险大脑实际上是面向监管部门,为监管部门提供服务的。

在2020年,当蚂蚁蚁盾决定将企业风险大脑的客户从政府监管部门扩展至企业时,他们发现,当时市面上已经有了一些企业信息聚合类平台。

例如2014年成立的企查查和天眼查,这样的平台已经初步具备企业风险评估能力。

当时蚂蚁蚁盾团队想到的是,要再往前走一步——不仅要做信息聚合,还要做信用逾期风险这样非常具体的风险评估。

而这其中的技术是蚂蚁蚁盾团队在支付宝内做风控时就已经开始在做的事,是他们擅长的领域。

于是,这一年,当有企业用到蚂蚁数科的企业风险大脑时,他们会发现,这一产品除了全网企业识别和舆情监控外,还融入了工商和司法舆情信息,并对这些信息做了进一步的解读和穿透,当点击基于这些信息生成的风险标签时,可以看到这一风险的判断依据。

信用逾期模型的加入,让蚂蚁蚁盾的企业风险大脑在进入企业市场时,有了自己的独特性,不过,只有这一个模型,远远无法满足企业市场的风云莫测。

章鹏发现,在这一产品进入市场后,要面对企业生产决策中的诸多考量。

“当我们只为企业提供这一个模型,企业工作流又是离线运行时,企业很难用起来。”

基于这样的考虑,蚂蚁蚁盾的企业风险大脑开始向2.0版本演进,搭建一站式工作台的想法也由此萌生。

在这个过程中,蚂蚁蚁盾团队不仅从拓客、准入到监控,构建起了全链路一站式平台,还通过搭建授权链路、引入私域数据,提升模型和决策能力。

与此同时,风险指标池、行业图谱、交互建模等技术开始被进一步引入。

当蚂蚁蚁盾的企业风险大脑进化为一站式产业风控平台时,已经与市场上的企业信息查询平台的逻辑完全不同,章鹏认为,二者至少有以下几点不同:

第一,我们不只是一个信息聚合平台,如今的蚁盾-产业风控平台已经走向一站式工作台,所以企业实际上已经能在这一平台上完成诸如获客、准入、监控等工作;

第二,蚁盾-产业风控平台不只基于公开数据,要把企业风险识别准,还要引入行业特征数据,甚至需要授权的私域数据,所以我们可以与企业生产系统进行打通,实现更精准的风险识别;

第三,我们希望和企业生产系统进行更多连接时,企业一定会对我们产品的准确性、效能有更高要求,因此我们也可以有更多定制,包括开放的能力出现,包括我们在做的数据和知识的交互式建模。

章鹏认为,现在蚁盾拥有的能力相当于“信息聚合+一站式工作台+与客户生产关系打通”。

这样的产业风控平台,嵌入到了企业事前、事中、事后全流程数智风险管理工作流中,从而为产业协作降低风险、提升效率。

02 数据驱动or知识驱动?

数据驱动,是消费互联网体系中的一个重要策略,然而,当进入到产业风控领域时,数据驱动这条路不再走得通。

“在消费互联网领域,数据足够多,有数据驱动就已经足够了;但在产业风控领域,实际情况刚好相反——这时我们往往有很多知识,但却没有足够多的数据,”章鹏如是说。

如此一来,要想做好产业风控,蚁盾就需要走出一条新路,一条将公域数据和私域数据有效融合的新路。

知识交互建模,就是蚁盾在这条路上摸索出来的一种新范式。

在知识交互建模范式中,整个建模过程被划分成了客户上传样本、样本扩充、生成样本标签、生成行业模型四步。

章鹏解释称,“在一个行业模型真实建模过程中,带标签的样本其实很少,因为一个企业运营系统中的逾期客户最多可能也只有三五十个,再多公司就要破产了。

“对于我们来说,如何根据行业经验(知识)扩展样本标签就成了问题的关键。”

据章鹏介绍,整个样本标签扩展过程,又可以分为如下几步:

首先,需要企业风控人员根据经验给出一定的规则,并结合蚁盾积累的行业模板,形成统一的准入规则;

其次,知识交互建模引擎借助弱监督学习,通过这些准确率并不高的规则,推断出很多新的企业,并为这些新企业打标签;

然后,专家根据新的企业标注,以及标签关联的结果和原因,对自动打标签的结果进行修正。

最后,通过专家修正后的标签更新平台规则。

“如此循环往复,当我们拥有足够多的标签时,我们的建模工作也就完成了一大半。”

章鹏告诉我们,“通过这样的知识交互建模方式,我们帮某个客户将样本标签扩展了5倍,AUC模型性能从60%提升到了85%,建模周期也从原来的数月缩短到了一周。”

03 平台构建的“二八定律”

时至今日,蚁盾已经是蚂蚁集团安全科技商业化品牌,对外提供包含身份安全、交易安全、合规安全等全链路风控产品和服务。

在2023年云栖大会上,蚁盾正式对外发布了“知识交互建模引擎”,通过将实体产业知识与AI模型有机结合,最快10分钟就能为企业定制自主可控的垂直领域AI风控引擎。

目前,这一引擎已经面向大宗商品行业开始落地测试。

蚁盾产品负责人李莎指出,“从最开始做一个通用平台给到某个具体客户,到客户提出更多功能需求,我们的算法团队进而帮客户做定制化需求的不断往复,我们现在依然处在一个从定制化产品向通用化产品转型过程中。”

“未来,我们期望的是80%的客户需求能够直接由我们通用平台中已有的能力得到满足,另外20%需要定制化的功能,我们会开放出来,由我们的合作伙伴来完成。”

不过,李莎也坦言,“我们现在还处于将我们通用平台的能力从能够满足客户50%的需求提高到80%的过程中。”