科学家新视野-AI协助海关查验非法交易

现行海关查缉非法进口交易作法,仰赖执法人员人工查核。图为海关人员查缉私烟。图/中央社

海关是一个国家进出口贸易最重要的机构,最重要的任务之一是查缉非法走私货物,有效查缉非法走私可减少犯罪并提高政府关税收入。现行查缉非法进口交易的作法仰赖执法人员人工查核,然而面对每天成千上万的进口货物,有限的人力难以全面查缉,若仅抽样查核一部份,又可能有漏网之鱼。

我们研究团队世界海关组织(World Customs Organization, WCO)合作,开发一套能够自动侦测非法交易的人工智慧演算法,简称为「DATE模型」,此模型能从海关进口交易的大数据中学习侦测非法走私。每一笔申报进口交易的纪录,包含商品类型数量重量价值资讯,都是DATE模型要学习的资料特征」。学习出这些特征与非法交易的潜在关联后,DATE模型能产生侦测为非法交易的机率值,海关查缉人员仅须专注于检测机率值较高的交易货品,机率值较低的交易货品则可以随机抽样或直接放行,减少人力成本。DATE模型除了侦测非法交易,更可以对侦测结果产生对应的可解释性文字,来辅助说明为何该交易货品是非法交易。

相较于传统机器学习方法,DATE模型有三个特点

1.能从交易货品的特征中,找出最有效辨识非法交易的特征组合,例如让AI判断「货品类型、价值、重量」此组合是否隐含非法交易的线索

2.可让AI学习特征组合与商品之间的关联性,若AI学习到「价值2~3万且重量2,000~3,000克」液晶电视谎报为「价值5,000~1万且重量500~1,000克」电脑荧幕的机率很高,就可让查验人员知道要特别注意这两个特征组合的关联。

3.训练AI能同时预测交易是否非法,以及预测交易能带来的额外关税收益

目前DATE模型已在奈及利亚马拉威的海关系统测试,让海关查缉人员可以只检测一百多万笔进口交易中的10%货品,就能找到所有非法交易的90%,并找回比传统机器学习方法还要多两倍的逃漏关税收益。通过测试后,DATE模型未来将会应用在这些国家的海关系统上。若要将DATE模型运用台湾,有几个值得留意的地方。首先,必须先确认台湾海关的进出口资料与WCO所提供之海关资料栏位是否契合,若栏位调整至相同,即能运用目前已经训练好的模型来侦测非法交易;若栏位难以调整,则重新进行资料前处理、训练专属台湾海关的AI模型。另一方面,不肖厂商可能根据不同国家的海关法规,钻不同的漏洞,所以不同国家的非法交易行为可能不同。为使DATE模型学习到台湾的非法交易行为,我们可用已经训练好的DATE模型,再加上台湾海关现有的非法交易资料并微调模型的参数,才能更好的转移模型到台湾海关的侦测系统上。

由于每日的交易数量相当庞大,目前多数先进国家不像奈及利亚等国海关,会检测每一笔进口交易,因此非法交易的标记数据非常稀少。针对此问题,我们团队正着手开发新的AI演算法,让不同国家的海关能利用现有大量的未标记数据,加上非常少量的标记数据,便能得到与目前DATE模型接近的准确性。于是,每个国家便不需仰赖以其他国家资料训练出来的模型,可以用自己国内海关进出口的资料来训练,不但能保密资料,更能让AI学到适合自己国家的模型。