歡迎關注七炅科技!
轉載請聯繫微信公眾號:七炅科技
http://www.DeltaEntropy.com
正文約3600字,預計閱讀時間為10分鐘
【前言】
AI技術已在我們的生活中的各個方面大顯身手:
除了上述案例以外,還有很多吸引眼球的應用,例如:紅綠燈自動調節、冬季流感的傳播預測、經濟犯罪偵查等。
隨著互聯網技術的發展,經濟犯罪的技術與手段也在不斷升級、更替,呈現出作案週期短、隱蔽性強、危害高等特點,不少違法分子甚至都拿起了AI作為犯罪工具。傳統的偵辦手段,已經難以又快又準地定位並偵破這些案件。
在2016年10月26日召開的第二屆全國經偵論壇上,公安部經濟犯罪偵查局局長高峯就表示,經濟犯罪偵查要擁抱新的技術革命,通過演算法來研究經濟犯罪對傳統經偵工作是革新和顛覆。
今天,筆者將以反洗錢偵查為例,闡述AI在經濟犯罪偵查上的應用,希望與行業人士共同交流進步。
【理論實踐相結合,快速偵破洗錢案件】
洗錢的重點在於「錢」的流動,因此「錢」的流轉信息具有非常重要的價值:
這些看似簡單明瞭的數據,是信息精鍊的成果。原始數據由於其體量極大、合理與異常交易混雜,給經濟犯罪偵查帶來極大難度。如果想靠人工的手段根據經驗查找異常記錄、追蹤犯罪線索,則需要投入大量的時間和人力。
因此,採用AI為基礎的數據挖掘的方法進行自動化反洗錢檢測,顯得重要且必要。
七炅團隊將理論與實踐相結合,平衡了實際應用的便利性與可操作性後,形成如下的演算法建立思路:
一、依據辦案經驗設立規則,從眾多賬戶中找出高嫌疑賬戶
二、從高嫌疑的賬戶中找出高嫌疑的轉賬記錄,從而檢測出高嫌疑的洗錢鏈路
三、藉助AI技術進一步定位關鍵賬戶,幫助辦案人員合理安排工作重點
另外,由於案件偵破的時效性需要,數據科學家們沒有足夠的時間在實驗室裏慢慢研究出「最完美」的演算法,故以「抓大放小」、「快速出結果」為目的對演算法進行設計。過程與結果並不完美,歡迎專家們提出寶貴的建議對其進行完善。
【找出高嫌疑賬戶】
俗話說:知己知彼,百戰不殆;把握洗錢的特點成為研究演算法的前提。為了找出高嫌疑的洗錢賬戶,需要制定一套嫌疑度標準或規則。
一般來說,這些標準或規則的制定是基於破案專業人員的經驗,考慮例如轉賬金額異常、轉賬次數異常、轉賬前後賬戶餘額比例異常、金額走向和轉賬時間異常等多個角度。
轉賬金額
洗錢的交易金額往往較高,具體金額的閾值可以根據案件偵查的實際需要進行調整,《金融機構大額交易和可疑交易報告管理辦法》等條例和規定都可以用作參考。
在實際應用中,通過對交易金額的篩選,可以大幅降低計算量需求,加速對大案要案的偵破時間。例如選擇50萬元作為閾值,計算量將減少70%以上。
轉賬次數
現代社會,洗錢往往是組織分工嚴密的活動,不會隨意讓無關人員參與。這意味著轉賬雙方必定多次合作。通過轉賬次數閾值的過濾,可以減少偶然性因素。
下圖為銀行交易數據中任何兩方參與轉賬的次數的分佈圖,通過篩選交易次數異常的數據,進一步降低計算的數據量。
金額走向類型
在一個特定觀察期內,一個賬戶的金額大致走向可以分為以下三種:
不同的金額走向代表的含義也不同,比如出入型,可能是洗錢的中間一環;入賬型可能是轉賬鏈條的末端;出賬型可能是轉賬鏈條的發端。通過特定時期金額走向,也可以幫助定位高嫌疑賬戶。
【檢測高嫌疑鏈路】
找到了涉案嫌疑較高的賬戶以後,還要對嫌疑轉賬記錄進行定位和追蹤。
洗錢的一個重要特點是:資金在各個賬號之間流轉,會形成一個鏈條。在實操中,鏈條對相關部門的監控和篩查十分重要:
其中首尾相同構成的「環路」可以視為一種特殊形式的鏈,比如A->B->C->A,它在時間軸上也是一條鏈。
若因為數據提取不全等原因,鏈條發生了斷裂,可以通過深挖發起賬戶或終點賬號對鏈條進行補充,有可能挖掘出更多的嫌疑鏈條。
而AI演算法可以從眾多交易中檢測到資金流轉鏈條,並對每個鏈條標記一個異常程度,異常程度的判斷依據是鏈條對應的交易信息。在具體情形中,可以根據鏈條長度、資金流轉速度、金額、交易發生地點等信息對判斷模型進行訓練。
值得一提的是,七炅的數據科學家們在實際應用過程中發現,異常交易的資金鏈條有逐年變長的趨勢。這反映了洗錢犯罪越來越專業化、隱蔽化。
【AI技術定位關鍵賬戶】
嫌疑鏈條定位成功後,還需要通過描述嫌疑鏈條上的賬戶之間的關係,幫助辦案人員定位關鍵賬戶。所謂關鍵賬戶,就是洗錢活動中的核心賬戶,若從中深挖找出犯罪證據,便可以將整個鏈路上的犯罪團夥一網打盡。
AI可視化技術幫助分析、定位關鍵賬戶
AI圖模型具有表達能力強、可視化、演算法成熟等特點,因此在數據形式轉化和最終呈現環節,都可以把數據表示為圖模型。
例如「數據」一節中的例子就可以轉化為下列圖模型,每個節點表示一個賬號,邊的方向表示資金轉移方向,例如資金從A轉向B,邊的權值為轉賬金額。
利用圖模型成熟演算法,可以在網路圖中挖掘很多信息。例如採用圖模型中的社區發現演算法,如標籤傳播演算法(Label Propagation Algorithm),發現網路中各「團夥」,示意圖如下:
在反洗錢檢測結束後,七炅的科學家們也採用了AI可視化技術呈現結果,使得嫌疑主體的信息一目瞭然:
圖中每個節點是一個主體,節點大小表示主體涉及資金量大小,顏色表示可疑程度。通過圖的可視化方法,把結果最終展示出來。
AI演算法計算各賬號嫌疑度
有時候只有上述的鏈條和團夥信息是不夠的,還需要一個可以用來幫助辦案人員抓大放小的賬號嫌疑程度的排名。
七炅的科學家們開發了獨特的匯總機制,綜合多種因素對賬號進行嫌疑程度排序,幫助辦案人員從公司主體、個人主體、賬號主體等多方面定位關鍵賬號,從而更加科學部署地警力進行進一步的信息獲取和偵察。
【總結】
本文簡要說明瞭利用AI技術進行反洗錢偵查的原理和基本思路。
在七炅的科學家們參與的案例中,演算法快速檢測出嫌疑交易金額高達幾千億,相關嫌疑記錄近百萬條,如果採用傳統人工審核方式將耗費巨大的人力與時間成本。
若採用AI的演算法和可視化技術,在數小時內即可獲得結果,並且由於其相關規則明確、計算可靠、輸出直觀、準確率高,可以在警力不足情況下得以廣泛複製,遏制犯罪。
【參考文獻】
1. Kirchner C,Gade J. Implementing social network analysis for fraud prevention[J]. CGI GroupInd, 2011.
2. Le Khac NA, Markos S, Kechadi M T. A data mining-based solution for detecting suspiciousmoney laundering cases in an investment bank[C]. Advances in DatabasesKnowledge and Data Applications (DBKDA), 2010 Second International Conferenceon. IEEE, 2010: 235-240.
3. Luo X.Suspicious transaction detection for anti-money laundering[J]. International Journalof Security and Its Applications, 2014.
4. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.
5. Sabau A S.Survey of clustering based financial fraud detection research[J]. InformaticaEconomica, 2012, 16(1): 110.
6. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.
7. Raghavan UN, Albert R, Kumara S. Near linear time algorithm to detect communitystructures in large-scale networks[J]. Physical review E, 2007, 76(3): 036106.