台湾 || 语言: 大陆简体港澳繁體台灣正體

使用邏輯回歸進行信用卡欺詐檢測

雪花台灣 2019-03-18 20:10

本篇notebook使用SMOTE平衡樣本，Logistic Regression建模，Confusion Matrix與ROC進行模型評估。

該項目使用的數據集是脫敏過的且經過PCA處理的數據，所以我們會先進行數據的探索，然後進行數據的預處理，其中包括不平衡樣本如何處理，我們在這裡會使用SMOTE進行不平衡樣本的處理；接著會應用Logistic Regression來建模並使用confusion matrix和ROC來評估模型。

如果想查看圖表相關的數據可視化及繪製代碼，可以點擊下面的原項目連接，Fork小科的這篇項目，運行本項目後，在想要查看代碼的cell上點擊右上角朝下的小箭頭來展開代碼cell即可查看。

項目連接：信用卡欺詐檢測--邏輯回歸

作者：小科

1. 數據探索

data = pd.read_csv(../input/fraud_detection/creditcardfraud.csv) data.shape

(284807, 31)

檢查是否有空值

data.isnull().values.sum()

0

查看前四行數據：

相关文章