欢迎关注七炅科技!
转载请联系微信公众号:七炅科技
http://www.DeltaEntropy.com
正文约3600字,预计阅读时间为10分钟
【前言】
AI技术已在我们的生活中的各个方面大显身手:
除了上述案例以外,还有很多吸引眼球的应用,例如:红绿灯自动调节、冬季流感的传播预测、经济犯罪侦查等。
随著互联网技术的发展,经济犯罪的技术与手段也在不断升级、更替,呈现出作案周期短、隐蔽性强、危害高等特点,不少违法分子甚至都拿起了AI作为犯罪工具。传统的侦办手段,已经难以又快又准地定位并侦破这些案件。
在2016年10月26日召开的第二届全国经侦论坛上,公安部经济犯罪侦查局局长高峰就表示,经济犯罪侦查要拥抱新的技术革命,通过演算法来研究经济犯罪对传统经侦工作是革新和颠覆。
今天,笔者将以反洗钱侦查为例,阐述AI在经济犯罪侦查上的应用,希望与行业人士共同交流进步。
【理论实践相结合,快速侦破洗钱案件】
洗钱的重点在于「钱」的流动,因此「钱」的流转信息具有非常重要的价值:
这些看似简单明了的数据,是信息精炼的成果。原始数据由于其体量极大、合理与异常交易混杂,给经济犯罪侦查带来极大难度。如果想靠人工的手段根据经验查找异常记录、追踪犯罪线索,则需要投入大量的时间和人力。
因此,采用AI为基础的数据挖掘的方法进行自动化反洗钱检测,显得重要且必要。
七炅团队将理论与实践相结合,平衡了实际应用的便利性与可操作性后,形成如下的演算法建立思路:
一、依据办案经验设立规则,从众多账户中找出高嫌疑账户
二、从高嫌疑的账户中找出高嫌疑的转账记录,从而检测出高嫌疑的洗钱链路
三、借助AI技术进一步定位关键账户,帮助办案人员合理安排工作重点
另外,由于案件侦破的时效性需要,数据科学家们没有足够的时间在实验室里慢慢研究出「最完美」的演算法,故以「抓大放小」、「快速出结果」为目的对演算法进行设计。过程与结果并不完美,欢迎专家们提出宝贵的建议对其进行完善。
【找出高嫌疑账户】
俗话说:知己知彼,百战不殆;把握洗钱的特点成为研究演算法的前提。为了找出高嫌疑的洗钱账户,需要制定一套嫌疑度标准或规则。
一般来说,这些标准或规则的制定是基于破案专业人员的经验,考虑例如转账金额异常、转账次数异常、转账前后账户余额比例异常、金额走向和转账时间异常等多个角度。
转账金额
洗钱的交易金额往往较高,具体金额的阈值可以根据案件侦查的实际需要进行调整,《金融机构大额交易和可疑交易报告管理办法》等条例和规定都可以用作参考。
在实际应用中,通过对交易金额的筛选,可以大幅降低计算量需求,加速对大案要案的侦破时间。例如选择50万元作为阈值,计算量将减少70%以上。
转账次数
现代社会,洗钱往往是组织分工严密的活动,不会随意让无关人员参与。这意味著转账双方必定多次合作。通过转账次数阈值的过滤,可以减少偶然性因素。
下图为银行交易数据中任何两方参与转账的次数的分布图,通过筛选交易次数异常的数据,进一步降低计算的数据量。
金额走向类型
在一个特定观察期内,一个账户的金额大致走向可以分为以下三种:
不同的金额走向代表的含义也不同,比如出入型,可能是洗钱的中间一环;入账型可能是转账链条的末端;出账型可能是转账链条的发端。通过特定时期金额走向,也可以帮助定位高嫌疑账户。
【检测高嫌疑链路】
找到了涉案嫌疑较高的账户以后,还要对嫌疑转账记录进行定位和追踪。
洗钱的一个重要特点是:资金在各个账号之间流转,会形成一个链条。在实操中,链条对相关部门的监控和筛查十分重要:
其中首尾相同构成的「环路」可以视为一种特殊形式的链,比如A->B->C->A,它在时间轴上也是一条链。
若因为数据提取不全等原因,链条发生了断裂,可以通过深挖发起账户或终点账号对链条进行补充,有可能挖掘出更多的嫌疑链条。
而AI演算法可以从众多交易中检测到资金流转链条,并对每个链条标记一个异常程度,异常程度的判断依据是链条对应的交易信息。在具体情形中,可以根据链条长度、资金流转速度、金额、交易发生地点等信息对判断模型进行训练。
值得一提的是,七炅的数据科学家们在实际应用过程中发现,异常交易的资金链条有逐年变长的趋势。这反映了洗钱犯罪越来越专业化、隐蔽化。
【AI技术定位关键账户】
嫌疑链条定位成功后,还需要通过描述嫌疑链条上的账户之间的关系,帮助办案人员定位关键账户。所谓关键账户,就是洗钱活动中的核心账户,若从中深挖找出犯罪证据,便可以将整个链路上的犯罪团伙一网打尽。
AI可视化技术帮助分析、定位关键账户
AI图模型具有表达能力强、可视化、演算法成熟等特点,因此在数据形式转化和最终呈现环节,都可以把数据表示为图模型。
例如「数据」一节中的例子就可以转化为下列图模型,每个节点表示一个账号,边的方向表示资金转移方向,例如资金从A转向B,边的权值为转账金额。
利用图模型成熟演算法,可以在网路图中挖掘很多信息。例如采用图模型中的社区发现演算法,如标签传播演算法(Label Propagation Algorithm),发现网路中各「团伙」,示意图如下:
在反洗钱检测结束后,七炅的科学家们也采用了AI可视化技术呈现结果,使得嫌疑主体的信息一目了然:
图中每个节点是一个主体,节点大小表示主体涉及资金量大小,颜色表示可疑程度。通过图的可视化方法,把结果最终展示出来。
AI演算法计算各账号嫌疑度
有时候只有上述的链条和团伙信息是不够的,还需要一个可以用来帮助办案人员抓大放小的账号嫌疑程度的排名。
七炅的科学家们开发了独特的汇总机制,综合多种因素对账号进行嫌疑程度排序,帮助办案人员从公司主体、个人主体、账号主体等多方面定位关键账号,从而更加科学部署地警力进行进一步的信息获取和侦察。
【总结】
本文简要说明了利用AI技术进行反洗钱侦查的原理和基本思路。
在七炅的科学家们参与的案例中,演算法快速检测出嫌疑交易金额高达几千亿,相关嫌疑记录近百万条,如果采用传统人工审核方式将耗费巨大的人力与时间成本。
若采用AI的演算法和可视化技术,在数小时内即可获得结果,并且由于其相关规则明确、计算可靠、输出直观、准确率高,可以在警力不足情况下得以广泛复制,遏制犯罪。
【参考文献】
1. Kirchner C,Gade J. Implementing social network analysis for fraud prevention[J]. CGI GroupInd, 2011.
2. Le Khac NA, Markos S, Kechadi M T. A data mining-based solution for detecting suspiciousmoney laundering cases in an investment bank[C]. Advances in DatabasesKnowledge and Data Applications (DBKDA), 2010 Second International Conferenceon. IEEE, 2010: 235-240.
3. Luo X.Suspicious transaction detection for anti-money laundering[J]. International Journalof Security and Its Applications, 2014.
4. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.
5. Sabau A S.Survey of clustering based financial fraud detection research[J]. InformaticaEconomica, 2012, 16(1): 110.
6. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.
7. Raghavan UN, Albert R, Kumara S. Near linear time algorithm to detect communitystructures in large-scale networks[J]. Physical review E, 2007, 76(3): 036106.