ROC曲線不平滑、局部有斜線，說明什麼？

在training dataset上面訓練好了隨機森林分類器之後，在獨立的test dataset（包含107個樣本）上面做測試。屬於不均衡數據，訓練集和測試集中正例大概佔10%。訓練分類器時，對少數類做了oversampling。特徵選擇後，剩下8個特徵。使用R package ROCR得到訓練集的ROC曲線如下：

數據集比較小的話 ROC 曲線確實會出現鋸齒狀。你只需要將 plot方法換成 scatter就能明白了。
比如下面我使用LR對偽造數據進行預測的 ROC 曲線：

你把測試集對應的預測分數輸出出來的話應該會發現很多分數是一樣的，所以才會出現這種情況。
樣本太少了吧。
推薦閱讀：

ROC曲線不平滑、局部有斜線，說明什麼？

热门新闻

周热门

ROC曲線不平滑、局部有斜線，說明什麼？

如果不從事機器學習，人工智慧，大數據這塊，未來還有機會在互聯網賺錢養家嗎？本人三本院校軟體專業。？

如何自學《模式識別與機器學習》這本書？

既然Python的庫能對大數據進行分析，那為何還要用Hadoop和Spark?

大數據是怎麼捉取你的信息的？

數據可視化究竟是什麼意思？

如何收集疫情防控信息數據？

為什麼softmax很少會出現[0.5，0.5]？

人工智慧領域裡的Interpretability和Explainability有什麼區別嗎？

有哪些非黑箱的機器學習模型，或者預測演算法？

ACL 2019將會有哪些值得關注的論文？

新手如何上手機器學習？

本人碩一小白，最近找課題，想問問深度學習GAN這個方向有哪些具有實際應用價值還好發文章的課題?

為什麼batch_size 增大會增加每一步的運算時間？

經典Python入門書籍都是python2.x, 先學這些再轉3.x難不難？

深度學習如何解決低信噪比下的檢測識別問題？

热门新闻

周热门