在不久前,小編曾經寫過一篇基於真實數據的申請評分卡,今天小編給大家帶來的是行為評分卡。
先給大家簡單介紹下行為評分卡與申請評分卡的區別:
申請評分卡:用於貸前,即客戶申請的時候,給客戶信用評級使用,所使用的欄位維度大多數為客戶基本申請信息,如年齡,學歷,收入等跟第三方數據源能獲取到的貸前信息,如通話詳單,多頭借貸,收支等等,第三方數據比較多,小編就不一一介紹,申請評分卡在建模要求上也比行為評分卡嚴格很多,最重要的要求就是模型的穩定性。
行為評分卡:用於貸後管理,大多數公司用於預測申請後的客戶是否會變為M3欺詐客戶(M3指的是逾期90天以上),也有不少公司用於復貸客群。所利用到的數據通常是貸後行為,如還款行為,消費行為,貸後的多頭借貸行為等等。行為評分卡在建模過程中與申請評分卡沒有多大區別,唯一的不同點就是所截取的欄位維度不同,好了,言歸正傳。
小編現在使用的是類似銀行數據,該數據欄位比較少,僅有客戶還款行為,月消費行為,以及逾期狀態信息,今天的代碼演示不會跟申請評分卡那麼詳細,有興趣的小夥伴,可以查看《基於工業數據申請評分卡》。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib
from sklearn.model_selection import GridSearchCV
from sklearn.cross_validation import train_test_split,cross_val_score
from sklearn.metrics import confusion_matrix
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import precision_score, recall_score, f1_score, roc_auc_score,accuracy_score
from sklearn.model_selection import StratifiedKFold,KFold,StratifiedShuffleSplit
from sklearn.tree import _tree
from sklearn import tree
import warnings
matplotlib.use(qt4agg)
matplotlib.rcParams[font.sans-serif] = [SimHei]
matplotlib.rcParams[font.family]=sans-serif
matplotlib.rcParams[axes.unicode_minus] = False
pd.set_option(display.max_rows, 100)
pd.set_option(display.max_columns, 10000)
%matplotlib inline
warnings.filterwarnings("ignore")
def readfile(isdf):
if isdf:
df=pd.read_csv("D:/data/behavioural data.csv")
return df
trainData=readfile(isdf=True)
我們先來看下有些什麼欄位維度吧。