行为评分卡在风控领域中起著违约监控和额度管理的作用。此外,在巴塞尔模型里,内部评级法模型(Internal Rating Based Model)也非常依赖于行为评分卡。

行为评分卡是 根据贷款人放贷后的表现行为,预测未来违约风险概率的模型;

通常使用是在贷款发放之后,到期之前的时间段,即「贷中」环节;

使用目的是监控贷款人在贷款结束之前的逾期/违约风险。

观察期与表现期

观察期:当前及过去的一段时间,用于搜集变数、特征的时间窗口,通常1年或半年之内

表现期:未来一段时间。

时间切片

定义:两个时刻间的跨度

例:观察日期之前30天内信用卡帐户的总消费额

基于时间切片的衍生

? 观察日期之前180天内,平均每月(30天)的逾期次数

常用的时间切片

? (1、2个)月,(1、2个)季度,半年,1年

时间切片的选择

? 不能太长:保证大多数样本都能覆盖到

? 不能太短:丢失信息

还款率类型特征:

额度使用率类型特征:

逾期类型特征:

消费类型特征:

因此最后的特征构造过程为:

观察期设为12个月。在观察期内,构造了时间窗口为1、3、6、12个月的时间切片每种时间切片内包含的行为变数类型:

逾期类: 最大逾期状态,M0/M1/M2的次数

额度使用类: 最大月额度使用率,平均月额度使用率,月额度使用率增加的月份

还款类: 最大月还款率,最小月还款率,平均月还款率

建模的过程与之前的过程类似:

只是在筛选变数部分,行为评分卡王王IV值较高,图为所有选择的变数IV分布图

然后进行单变数分析和双变数分析:

第一次逻辑回归

发现变数minPayL3M_Bin_WOE和 M2FreqL1M_WOE的系数为正 ;maxDelqL12M_Bin_WOE系数不显著。要单独检验这三个变数

经过检验发现单变数构建模型时候,系数的符号和p值都是符合要求的,说明依然有多重共线性的存在。

第二次筛选,需要保证得到的模型所有的变数的系数都为负,而且显著。

检验模型的性能:

最终得到的模型的KS和AUC,分别是60%和82%,已经是不错的水平了。


推荐阅读:
相关文章