行为评分卡在风控领域中起著违约监控和额度管理的作用。此外,在巴塞尔模型里,内部评级法模型(Internal Rating Based Model)也非常依赖于行为评分卡。
行为评分卡是 根据贷款人放贷后的表现行为,预测未来违约风险概率的模型;
通常使用是在贷款发放之后,到期之前的时间段,即「贷中」环节;
使用目的是监控贷款人在贷款结束之前的逾期/违约风险。
观察期:当前及过去的一段时间,用于搜集变数、特征的时间窗口,通常1年或半年之内
表现期:未来一段时间。
定义:两个时刻间的跨度
例:观察日期之前30天内信用卡帐户的总消费额
? 观察日期之前180天内,平均每月(30天)的逾期次数
? (1、2个)月,(1、2个)季度,半年,1年
? 不能太长:保证大多数样本都能覆盖到
? 不能太短:丢失信息
因此最后的特征构造过程为:
观察期设为12个月。在观察期内,构造了时间窗口为1、3、6、12个月的时间切片每种时间切片内包含的行为变数类型:
逾期类: 最大逾期状态,M0/M1/M2的次数
额度使用类: 最大月额度使用率,平均月额度使用率,月额度使用率增加的月份
还款类: 最大月还款率,最小月还款率,平均月还款率
建模的过程与之前的过程类似:
只是在筛选变数部分,行为评分卡王王IV值较高,图为所有选择的变数IV分布图
然后进行单变数分析和双变数分析:
第一次逻辑回归
发现变数minPayL3M_Bin_WOE和 M2FreqL1M_WOE的系数为正 ;maxDelqL12M_Bin_WOE系数不显著。要单独检验这三个变数
经过检验发现单变数构建模型时候,系数的符号和p值都是符合要求的,说明依然有多重共线性的存在。
第二次筛选,需要保证得到的模型所有的变数的系数都为负,而且显著。
检验模型的性能:
最终得到的模型的KS和AUC,分别是60%和82%,已经是不错的水平了。