人工智慧已成為目前最炙手可熱的方向。

回想起若干年前,在本科人工智慧的選修課上,老師介紹了機器學習模型能用於預測,這一點深深吸引了我。我當時的想法很簡單,要是學好人工智慧,用於炒股,我就能幫母親在股市裡賺錢。在導師的指導下,我在大四花了大半年時間專研神經網路及優化演算法,也發表了論文若干。可是,我滿懷期待地把研發成果用在A股數據上模擬炒股,卻失敗了。

所以,如何恰當地定義用模型去解決的問題,然後如何應用模型去解決問題,並沒那麼簡單。

繼續懷著為母親在股市裡賺錢的夢想,我踏上人工智慧的出國求學路。學成之後,我如願以償地運用機器學習實現了能獲得不錯收益的自動交易演算法。後來,由於一次機緣巧合我投入到了我認為更有意義的,大數據信貸風控的事業中。

Google在無人駕駛汽車的階段性成功,設計出AlphaGo和Master在圍棋界戰勝人類,讓人們見識到人工智慧的威力。那麼,人工智慧、機器學習在信貸風控中能起到多大的作用?

用機器學習看問題的角度,無人駕駛汽車和圍棋兩個問題有很大共性。即1)所掌握的數據能夠完全描述和評估情況,理論上不存在無法預料的不確定性;2)可以創造或模擬出無數種汽車行駛環境或棋局供機器去學習。行駛中的環境和狀態和對弈中的棋局形式能夠抽象成數據描述,並且可以有效評估。

例如,在棋局上是否佔優,可以通過計算得到客觀的結果。在樣本量充足的情況下,深度學習技術賦予了機器識別和評估千變萬化的行駛狀況和棋局情況的能力,再通過搜索演算法遍歷各種可能性,演練將要發生的情況,最後做出最佳應對行動。

但在信貸領域,我們通常不具備這兩大問題所具有的條件 – 我們無法獲取反映各類人羣資質的完整數據,人在未來是否還款具有不確定性,也沒有足夠多的樣本供最強大的機器學習模型去學習。

然而,隨著大數據風控、大數據徵信的發展,這些不具備的條件也在快速改善。

首先,政府、具有大量數據積累的公司、以及大數據風控的同業都在為如何更好地利用數據努力。各類數據,如信貸行為、消費行為、社交、衣食住行、政府類數據的積累、獲取、打通、整合、加工,為信用評估,特別是無央行徵信情況下的信用評估提供了重要參考依據。

其次,如何從各類數據中挖掘出有效信息並整合成因子作為信用風險模型輸入,機器學習、模式識別技術可以發揮很大作用。在信貸領域,增加有效的數據,並通過適當的處理方法把數據表現成模型因子帶來的提高通常比在模型上的優化更顯著。

如今,傳統的基於邏輯回歸的評分模型開發方法已非常普及,也有大量分析建模從業人員能夠運用常用的機器學習模型。但簡單的把傳統模型替換成常用機器學習模型並不會帶來很大改變。在信貸風控領域,真正能通過設計模型組合應用方案,設計模型優化演算法帶來預測精度有效提升的案例還很少見。實踐證明,在相同數據集上,當數據維度的包含的信息複雜度和數據量達到一定程度時,通過優化的神經網路、組合模型等方法可以提升預測性能。

此外,其它人工智慧技術的應用,如人臉識別、虹膜識別、語音識別等技術的成熟和應用在反欺詐、身份核實、減少人工幹預和提升用戶體驗等方面可以發揮重要作用。

隨著社會各類數據的整合和打通,圖像識別、文本挖掘技術的不斷成熟和產品化,以及大量專業人士對人工智慧的關注,人工智慧等新技術一定能在信貸風控領域發揮越來越大的價值。

然而,模型、大數據、機器學習是否將代表風控的所有?對於大數據風控從業者來說,我想最根本的,要有在風控問題上嚴謹的態度和縝密的分析,對業務的瞭解,以及對市場、對風險的敬畏之心,在此基礎上,做技術的應用者,把新技術以最恰當的方式融合到風控體系的某環節。

我經歷了歐美非銀行信貸機構不斷湧現時期。那時候,比較典型的是年化利率超過2000%的發薪日貸款迅猛發展,從僅有幾位員工的公司在數月內擴張到幾層辦公樓規模,而這樣的事在那段時間屢見不鮮。收益最大化驅動的風控策略是,做基本身份核實後裸放,到市場過飽和、過渡授信致使量化模型已無法量化風險,最佳策略變成一筆也不放。後來監管趨於規範嚴格,只有實力強、深耕風控技術的公司才活得比較好。

把時間坐標軸向後移幾年,中國在經歷銀行引進評分模型,實施巴塞爾協議,到小貸公司興起,再到互聯網金融,大數據徵信,以及現在銀行面臨困境和金融科技的發展。中國市場上,正經歷著和歐美同樣的故事。

而如今,大數據徵信、大數據風控、金融科技,我們更像在創造具有自己特色的故事。新公司雨後春筍般成立、迅猛發展、到瓶頸期、監管整頓、轉型和消亡,在中國市場,一切都來得更加快速和猛烈。正如P2P公司正一家接一家消亡,也許一兩年後,許多所謂的金融科技公司也會有同樣的遭遇。公司能在浪潮中持續發展的關鍵因素,也是風控能力。

有一個有趣的發現是,國外不少優秀的金融公司或因種種原因並沒有使用評分模型,而是結合業務經驗和數據分析,以精準覆蓋所有風險點為目標制定了上百條規則。在此基礎上,採用評分模型和機器學習方法或多或少能把準確度進一步提高。

然而,現實中常常需要達到業務穩定、數據積累充足、併到某個發展階段等各種條件後才開發量化模型,並可能只是起到錦上添花的效果。相比之下,在這個案例中,最初把控住風險的上百條規則顯得更有價值。設計規則的人,或許對業務有足夠深入的理解和把握、有多年風控實踐經驗、並做了大量嚴謹的分析和推敲。如果把最終的智能風控體系比做AlphaGo,其一半的智能來自於深諳風控之道的人。

在實現普惠金融的道路上,我們會給各種場景以及沒有被傳統信貸服務到的人羣提供信貸服務,但這類產品在一段時間內常常不完全具備建立統計模型的條件。此時,諸如對業務的理解、對風險點的列舉分析、風控體系設計、風控尺度的把握等能力顯得尤為重要。

前途是光明的,伴隨數據的加速整合,人工智慧等新技術應用和風控經驗指導三方面產生化學反應,我相信未來的大數據風控會不斷給我們帶來驚喜。


推薦閱讀:
相關文章