歡迎關注七炅科技!

轉載請聯繫微信公眾號:七炅科技

DeltaEntropy.com

正文約3600字,預計閱讀時間為10分鐘

【前言】

AI技術已在我們的生活中的各個方面大顯身手:

  • 預測車輛駕駛風險
  • 疾病規律和治療風險
  • 快速判斷屏蔽垃圾簡訊
  • 提前預測機械設備何時損壞
  • ……

除了上述案例以外,還有很多吸引眼球的應用,例如:紅綠燈自動調節、冬季流感的傳播預測、經濟犯罪偵查等。

隨著互聯網技術的發展,經濟犯罪的技術與手段也在不斷升級、更替,呈現出作案週期短、隱蔽性強、危害高等特點,不少違法分子甚至都拿起了AI作為犯罪工具。傳統的偵辦手段,已經難以又快又準地定位並偵破這些案件。

在2016年10月26日召開的第二屆全國經偵論壇上,公安部經濟犯罪偵查局局長高峯就表示,經濟犯罪偵查要擁抱新的技術革命,通過演算法來研究經濟犯罪對傳統經偵工作是革新和顛覆

今天,筆者將以反洗錢偵查為例,闡述AI在經濟犯罪偵查上的應用,希望與行業人士共同交流進步。

【理論實踐相結合,快速偵破洗錢案件】

洗錢的重點在於「錢」的流動,因此「錢」的流轉信息具有非常重要的價值:

這些看似簡單明瞭的數據,是信息精鍊的成果。原始數據由於其體量極大、合理與異常交易混雜,給經濟犯罪偵查帶來極大難度。如果想靠人工的手段根據經驗查找異常記錄、追蹤犯罪線索,則需要投入大量的時間和人力。

因此,採用AI為基礎的數據挖掘的方法進行自動化反洗錢檢測,顯得重要且必要。

七炅團隊將理論與實踐相結合,平衡了實際應用的便利性與可操作性後,形成如下的演算法建立思路:

一、依據辦案經驗設立規則,從眾多賬戶中找出高嫌疑賬戶

二、從高嫌疑的賬戶中找出高嫌疑的轉賬記錄,從而檢測出高嫌疑的洗錢鏈路

三、藉助AI技術進一步定位關鍵賬戶,幫助辦案人員合理安排工作重點

另外,由於案件偵破的時效性需要,數據科學家們沒有足夠的時間在實驗室裏慢慢研究出「最完美」的演算法,故以「抓大放小」、「快速出結果」為目的對演算法進行設計。過程與結果並不完美,歡迎專家們提出寶貴的建議對其進行完善。

【找出高嫌疑賬戶】

俗話說:知己知彼,百戰不殆;把握洗錢的特點成為研究演算法的前提。為了找出高嫌疑的洗錢賬戶,需要制定一套嫌疑度標準或規則。

一般來說,這些標準或規則的制定是基於破案專業人員的經驗,考慮例如轉賬金額異常、轉賬次數異常、轉賬前後賬戶餘額比例異常、金額走向和轉賬時間異常等多個角度。

轉賬金額

洗錢的交易金額往往較高,具體金額的閾值可以根據案件偵查的實際需要進行調整,《金融機構大額交易和可疑交易報告管理辦法》等條例和規定都可以用作參考。

在實際應用中,通過對交易金額的篩選,可以大幅降低計算量需求,加速對大案要案的偵破時間。例如選擇50萬元作為閾值,計算量將減少70%以上。

轉賬次數

現代社會,洗錢往往是組織分工嚴密的活動,不會隨意讓無關人員參與。這意味著轉賬雙方必定多次合作。通過轉賬次數閾值的過濾,可以減少偶然性因素。

下圖為銀行交易數據中任何兩方參與轉賬的次數的分佈圖,通過篩選交易次數異常的數據,進一步降低計算的數據量。

金額走向類型

在一個特定觀察期內,一個賬戶的金額大致走向可以分為以下三種:

  • 出賬型:只出不進、出賬遠大於入賬的賬戶
  • 入賬型:只入不出、入賬遠大於出賬的賬戶
  • 出入型:有入有出,出入懸殊不大的賬戶

不同的金額走向代表的含義也不同,比如出入型,可能是洗錢的中間一環;入賬型可能是轉賬鏈條的末端;出賬型可能是轉賬鏈條的發端。通過特定時期金額走向,也可以幫助定位高嫌疑賬戶。

【檢測高嫌疑鏈路】

找到了涉案嫌疑較高的賬戶以後,還要對嫌疑轉賬記錄進行定位和追蹤。

洗錢的一個重要特點是:資金在各個賬號之間流轉,會形成一個鏈條。在實操中,鏈條對相關部門的監控和篩查十分重要:

  • 鏈條代表著洗錢活動的痕跡,是洗錢發生的過程的真實記錄
  • 鏈條上的所有賬號都是「一條繩上的螞蚱」,就算隔了很多「中間賬號」也能找到內在關聯,往往能發現「隱藏」的洗錢賬號
  • 通過鏈條可以發現洗錢行為的發起賬戶和終點賬號

其中首尾相同構成的「環路」可以視為一種特殊形式的鏈,比如A->B->C->A,它在時間軸上也是一條鏈。

若因為數據提取不全等原因,鏈條發生了斷裂,可以通過深挖發起賬戶或終點賬號對鏈條進行補充,有可能挖掘出更多的嫌疑鏈條。

而AI演算法可以從眾多交易中檢測到資金流轉鏈條,並對每個鏈條標記一個異常程度,異常程度的判斷依據是鏈條對應的交易信息。在具體情形中,可以根據鏈條長度、資金流轉速度、金額、交易發生地點等信息對判斷模型進行訓練。

值得一提的是,七炅的數據科學家們在實際應用過程中發現,異常交易的資金鏈條有逐年變長的趨勢。這反映了洗錢犯罪越來越專業化、隱蔽化。

【AI技術定位關鍵賬戶】

嫌疑鏈條定位成功後,還需要通過描述嫌疑鏈條上的賬戶之間的關係,幫助辦案人員定位關鍵賬戶。所謂關鍵賬戶,就是洗錢活動中的核心賬戶,若從中深挖找出犯罪證據,便可以將整個鏈路上的犯罪團夥一網打盡。

AI可視化技術幫助分析、定位關鍵賬戶

AI圖模型具有表達能力強、可視化、演算法成熟等特點,因此在數據形式轉化和最終呈現環節,都可以把數據表示為圖模型。

例如「數據」一節中的例子就可以轉化為下列圖模型,每個節點表示一個賬號,邊的方向表示資金轉移方向,例如資金從A轉向B,邊的權值為轉賬金額。

利用圖模型成熟演算法,可以在網路圖中挖掘很多信息。例如採用圖模型中的社區發現演算法,如標籤傳播演算法(Label Propagation Algorithm),發現網路中各「團夥」,示意圖如下:

在反洗錢檢測結束後,七炅的科學家們也採用了AI可視化技術呈現結果,使得嫌疑主體的信息一目瞭然:

圖中每個節點是一個主體,節點大小表示主體涉及資金量大小,顏色表示可疑程度。通過圖的可視化方法,把結果最終展示出來。

AI演算法計算各賬號嫌疑度

有時候只有上述的鏈條和團夥信息是不夠的,還需要一個可以用來幫助辦案人員抓大放小的賬號嫌疑程度的排名。

七炅的科學家們開發了獨特的匯總機制,綜合多種因素對賬號進行嫌疑程度排序,幫助辦案人員從公司主體、個人主體、賬號主體等多方面定位關鍵賬號,從而更加科學部署地警力進行進一步的信息獲取和偵察。

【總結】

本文簡要說明瞭利用AI技術進行反洗錢偵查的原理和基本思路。

在七炅的科學家們參與的案例中,演算法快速檢測出嫌疑交易金額高達幾千億,相關嫌疑記錄近百萬條,如果採用傳統人工審核方式將耗費巨大的人力與時間成本。

若採用AI的演算法和可視化技術,在數小時內即可獲得結果,並且由於其相關規則明確、計算可靠、輸出直觀、準確率高,可以在警力不足情況下得以廣泛複製,遏制犯罪。

【參考文獻】

1. Kirchner C,Gade J. Implementing social network analysis for fraud prevention[J]. CGI GroupInd, 2011.

2. Le Khac NA, Markos S, Kechadi M T. A data mining-based solution for detecting suspiciousmoney laundering cases in an investment bank[C]. Advances in DatabasesKnowledge and Data Applications (DBKDA), 2010 Second International Conferenceon. IEEE, 2010: 235-240.

3. Luo X.Suspicious transaction detection for anti-money laundering[J]. International Journalof Security and Its Applications, 2014.

4. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.

5. Sabau A S.Survey of clustering based financial fraud detection research[J]. InformaticaEconomica, 2012, 16(1): 110.

6. BerlusconiG, Calderoni F, Parolini N, et al. Link prediction in criminal networks: A toolfor criminal intelligence analysis[J]. PloS one, 2016, 11(4): e0154244.

7. Raghavan UN, Albert R, Kumara S. Near linear time algorithm to detect communitystructures in large-scale networks[J]. Physical review E, 2007, 76(3): 036106.


推薦閱讀:
相關文章