R语言信用评分卡：拒绝推断（5）特征工程B

作者：黄天元，复旦大学博士在读，热爱数据科学与R，热衷推广R在工业界与学术界的应用。知乎专栏：R语言数据挖掘 邮箱：[email protected].欢迎合作交流。

相关连接：

HopeR：R语言信用评分卡：拒绝推断（1）问题定义

HopeR：R语言信用评分卡：拒绝推断（2）特征筛选A

HopeR：R语言信用评分卡：拒绝推断（3）特征筛选B

HopeR：R语言信用评分卡：拒绝推断（4）特征工程A

提要：

Hope现在作为金融风控分析师就职于A金融公司，之前的风控模型在1月份违约率为6.5%，2月份调整之后达到了4.7%，可喜可贺。但是公司领导Kate居安思危，认为目前市场的波动很大，用户的心理和行为的变化很敏感，因此要再次更新模型。Kate让Hope就1、2月份的所有数据（包括放款的数据和未放款的数据），对放款规则进行更新，来获得更加好的效果。就在2月末3月初，Hope开始做这个模型，尝试保持甚至提高3月份的业绩，并对4、5月份的决策做出指导。

目前进度：

对一月份的数据做了特征工程，并做了一个简单的逻辑回归模型。但是还没有进行验证。

让我们看看之前筛选好的特征：