把痛點變賣點！金融行業 AI 將開啟無監督式學習潮流

許多人工智慧專家常說 AI 最適合應用於金融行業。因為金融是歷史記錄數據最豐富且準確的領域之一，甚至斷言金融行業將被 AI 取代。但有個極大的問題是，人工智慧無法解釋自己的行為，這使得強監管的金融行業很難大規模採用 AI。

當銀行考慮採用人工智慧時，這個所謂的「黑盒子」問題就會反覆出現，無論是信用評分，貸款還是其它類型業務。

一位長期從事金融風控領域的業內高管直言，傳統銀行普遍都希望利用社交網站來進行營銷，但如果銀行不能明確掌握所有客戶屬性數據，就很容易被合規部門擋下。

金融業最適合AI ？實際程度低於整體平均！

這類限制使得銀行在 AI 導入的實際業務上，存在著理想與現實的巨大落差。

根據「麻省理工斯隆管理評論」（MIT Sloan Management Review）與「波士頓顧問集團」（The Boston Consulting Group）於 2017 年所做研究」RESHAPING BUSINESS WITH ARTIFICIAL INTELLIGENCE」，調查人工智慧在各行業的被採納程度。結果金融服務業評估目前 AI 對其產品服務、工作流程的影響程度僅約 10％，甚至低於整體平均 (見下圖)。

圖說 | 各行業 AI 採用程度：對產品服務影響程度（來源：MIT Sloan Management Review）

圖說 | 各行業 AI 採用程度：對工作流程影響程度（來源：MIT Sloan Management Review）

甚至許多情況下，銀行即便導入 AI，效果也不如想像神奇。

例如金融機構導入傳統規則引擎系統來進行檢核其實已行之有年，但缺點是真實金融場景的維度太多，人工定義的規則引擎無法做到很精準判別。為了寧枉勿縱，系統就存在大量誤報。因此即使採用規則引擎，對人工審核的要求仍然非常巨大。

「國際上各大金融機構對反洗錢都是投入大量的人力，人工審核部門都非常巨大，」一位業內人士表示，這除了使成本居高不下之外，更大的風險是繁複檢核容易使客戶不滿、甚至失去客戶。

業者解釋，洗錢行為必須經過司法部門調查才能確立罪責，所以要求要很強的解釋性。如果 AI 只能指出某個帳號可疑，卻無法自我解釋原因時，調查人員就無法據以展開進一步調查。

無監督式學習是金融行業AI 應用突破新方向

而機器學習中的一個晚近分支——無監督式學習（UML），正是一種能夠自我解釋的 AI。

圖說 | 可解釋 AI 與今日機器學習 AI 的差異（來源：DARPA）

無監督式學習是機器學習的一種方式，訓練時不需要人力給予標籤，僅須對機器提供數據輸入。因為沒有預設標籤，無監督式學習機器不會知道其分類結果是否正確，但優點在於它會自動從數據中找出潛在的規則，因此其結果具有較強的可解釋性。

Facebook 人工智慧負責人、也是 AI 領域最有影響力的專家之一的 Yann LeCun，就多次提倡無監督式學習是 AI 技術的未來。

無監督式學習雖已在學研界是一大主流方向，但在產業界大規模成功應用的例子還並不多，用於金融領域的更是少之又少。但一家由兩名華人女性共同在美國矽谷創辦的人工智慧新創公司 DataVisor，卻是最領先將無監督式學習應用在金融領域的公司之一。

DataVisor 以「無監督機器學習」（UML）引擎為核心，結合傳統自動規則引擎和全球資料庫，致力於解決金融領域的在線欺詐和金融犯罪檢測難題，可對每小時新發生的 10 億數量級的事件進行分析，自動判斷並發現潛在的惡意攻擊，至今在全球範圍內已處理超 6000 億用戶事件和 1.4 億壞用戶，保護全球 40 億互聯網用戶，最近併入選《華爾街日報》最新發布的「2018 最值得關注科技公司 Top25」榜單。

DT 君獨家專訪 DataVisor，剖析無監督機器學習在金融領域的應用優勢。聯合創始人兼 CEO 謝映蓮說明，金融行業數據豐富，但數字化並不完善，這是對所有機器學習模式的一個普遍存在的挑戰。而無監督式學習的好處在於對數據缺失的容忍力較高，並不依賴數據的完整性。

圖說 | DataVisor 聯合創始人兼 CEO 謝映蓮（左）、DataVisor CTO 俞舫（右）

「無監督機器學習的優勢是可以將海量數據在沒有標籤的情況下進行檢測，且產出的結果具有很強的可解釋性。」

謝映蓮進一步說明，無監督式學習是機器學習的一個分支，相較於監督式學習和強化學習等其它分支，無監督學習並不需要人力來輸入標籤，而是主動實時找尋新的模式，進行新的學習。

圖說 | 有監督機器學習模型通常單獨查看每個賬戶，類似於每次看這幅畫中的一個點。無監督機器學習可分析賬戶間的關聯性，即便個體賬戶無任何可疑表象，也能從數據中檢測到可疑模型。這種方式類似於我們能看到並理解畫中的整體圖案而不是每一點，即便每個點的顏色和形狀都不盡相同。

為何無監督式學習有助於解決人工智慧在金融行業應用的痛點呢？

「這跟金融行業自身的發展改變有關」，DataVisor 聯合創始人兼 CTO 俞舫解釋，「過去金融工具比較單純，欺詐形式與危害程度都比較有限。但現在網路交易愈來愈頻繁，犯罪形式也日新月異，等到有標籤後再做機器學習很多時候已經晚了，在反應新型攻擊上是非常滯後的。」

而無監督學習可以使海量數據在沒有標籤的情況下進行檢測，把群組性的異常找出來，且產出的結果具有很強的可解釋性，甚至能在攻擊未發生前就防患於未然。

以國內猖獗的網路黑產主導的數字金融欺詐為例，DataVisor 中國區總經理吳中說明，金融欺詐如要惡意轉帳，通常會有個過程。首先攻擊者需要創建大量惡意帳號，接著需要「養號」，也就是為帳號製造一些貌似正常的紀錄，接下來才能用這些帳號進行欺詐。而傳統規則引擎、或有標籤的監督式學習，比較難檢測出養號早期、貌似正常的惡意帳號。無監督式學習則是會主動把群組性的異常找出來，提供人員進行預判。

吳中觀察，正因國內黑產盛行，可以看到金融機構將對人工智慧產生更多的需求，會更有意識地去探索。

在數據飛速增長的情況下，國內金融機構勢必將進入升級換代的過程。儘管目前仍有其限制，但整個行業已在加速奔向由人工智慧驅動的未來。沒人能夠真正準確預測人工智慧下一個突破將何時出現，但更有意識地探索，將是保持領先的關鍵。