台湾 || 语言: 大陆简体港澳繁體台灣正體

對多分類數據的模型比較選擇，應該參考什麼指標？

雪花台灣 2021-01-13 09:42

對於一個binary classification的問題來說，我知道可以比較Area Under PR，Area Under ROC來判斷到底是哪個模型有更好的性能。但是我的理解是這兩個都是只能針對二分類問題而言，因為真假陽性都僅僅是Positive和Negative的比較。那麼如果是對一個multi-classification的問題，使用不同的模型進行模擬，該用什麼來判斷到底哪個模型比較好？accuracy？

提供一種多見的評價。

1.二分類

F1 score = 2 * P * R / (P + R)

其中，準確率(precise) P = TP / (TP + FP)，召回率(recall) R = TP / (TP + FN)

2.多分類[1]

Macro F1: 將n分類的評價拆成n個二分類的評價，計算每個二分類的F1 score，n個F1 score的平均值即為Macro F1。

Micro F1: 將n分類的評價拆成n個二分類的評價，將n個二分類評價的TP、FP、RN對應相加，計算評價準確率和召回率，由這2個準確率和召回率計算的F1 score即為Micro F1。

一般來講，Macro F1、Micro F1高的分類效果好。Macro F1受樣本數量少的類別影響大。

[1] Liu, C., Wang, W., Wang, M., Lv, F., Konan, M. (2017). An efficient instance selection algorithm to reconstruct training set for support vector machine. Knowledge-Based Systems, 116(1), 58-73.

相关文章