台湾 || 语言: 大陆简体港澳繁體台灣正體

对多分类数据的模型比较选择，应该参考什么指标？

雪花台湾 2021-01-13 09:42

对于一个binary classification的问题来说，我知道可以比较Area Under PR，Area Under ROC来判断到底是哪个模型有更好的性能。但是我的理解是这两个都是只能针对二分类问题而言，因为真假阳性都仅仅是Positive和Negative的比较。那么如果是对一个multi-classification的问题，使用不同的模型进行模拟，该用什么来判断到底哪个模型比较好？accuracy？

提供一种多见的评价。

1.二分类

F1 score = 2 * P * R / (P + R)

其中，准确率(precise) P = TP / (TP + FP)，召回率(recall) R = TP / (TP + FN)

2.多分类[1]

Macro F1: 将n分类的评价拆成n个二分类的评价，计算每个二分类的F1 score，n个F1 score的平均值即为Macro F1。

Micro F1: 将n分类的评价拆成n个二分类的评价，将n个二分类评价的TP、FP、RN对应相加，计算评价准确率和召回率，由这2个准确率和召回率计算的F1 score即为Micro F1。

一般来讲，Macro F1、Micro F1高的分类效果好。Macro F1受样本数量少的类别影响大。

[1] Liu, C., Wang, W., Wang, M., Lv, F., Konan, M. (2017). An efficient instance selection algorithm to reconstruct training set for support vector machine. Knowledge-Based Systems, 116(1), 58-73.

相关文章