R語言信用評分卡：拒絕推斷（5）特徵工程B

作者：黃天元，復旦大學博士在讀，熱愛數據科學與R，熱衷推廣R在工業界與學術界的應用。知乎專欄：R語言數據挖掘 郵箱：[email protected].歡迎合作交流。

相關連接：

HopeR：R語言信用評分卡：拒絕推斷（1）問題定義

HopeR：R語言信用評分卡：拒絕推斷（2）特徵篩選A

HopeR：R語言信用評分卡：拒絕推斷（3）特徵篩選B

HopeR：R語言信用評分卡：拒絕推斷（4）特徵工程A

提要：

Hope現在作為金融風控分析師就職於A金融公司，之前的風控模型在1月份違約率為6.5%，2月份調整之後達到了4.7%，可喜可賀。但是公司領導Kate居安思危，認為目前市場的波動很大，用戶的心理和行為的變化很敏感，因此要再次更新模型。Kate讓Hope就1、2月份的所有數據（包括放款的數據和未放款的數據），對放款規則進行更新，來獲得更加好的效果。就在2月末3月初，Hope開始做這個模型，嘗試保持甚至提高3月份的業績，並對4、5月份的決策做出指導。

目前進度：

對一月份的數據做了特徵工程，並做了一個簡單的邏輯回歸模型。但是還沒有進行驗證。

讓我們看看之前篩選好的特徵：