偏差與方差，欠擬合與過擬合

前言

這篇文章是關於調參中常遇到的欠擬合與過擬合問題，通過將四個概念：偏差，方差，欠擬合，過擬合連接起來，能夠更好的理解這個問題。最後，針對該問題，我提出了幾點建議。

泛化能力[1]

機器學習演算法的目的是使得我們的演算法能夠在先前未預測的新輸入上表現良好，而不只是在訓練集上表現良好。而這種在新數據上表現良好的能力被稱為演算法的泛化能力。

簡單來說，如果說一個模型在測試集上表現的與訓練集一樣好，我們就說這個模型的泛化能力很好；如果模型在訓練集上表現良好，但在測試集上表現一般，就說明這個模型的泛化能力不好。

從誤差的角度來說，泛化能力差就是指的是測試誤差比訓練誤差要大的情況，所以我們常常採用訓練誤差，測試誤差來判斷模型的擬合能力，這也是測試誤差也常常被稱為泛化誤差的原因。

欠擬合與過擬合

我們在訓練模型的時候有兩個目標：

降低訓練誤差，尋找針對訓練集最佳的擬合曲線。
縮小訓練誤差和測試誤差的差距，增強模型的泛化能力。

這兩大目標就對應機器學習中的兩大問題：欠擬合與過擬合。具體來講：

欠擬合是指模型在訓練集與測試集上表現都不好的情況，此時，訓練誤差，測試誤差都很大。
過擬合是指模型在訓練集上表現良好，但在測試集上表現不好的情況，此時，訓練誤差很小，測試誤差很大，模型泛化能力不足。

偏差與方差，欠擬合與過擬合

前言

泛化能力[1]

欠擬合與過擬合

偏差與方差 -- bias 與 variance [2]

偏差與方差的權衡

通過學習曲線來判斷偏差與方差

如何降低偏差[2]

如何降低方差[2]

Reference

熱門新聞

週熱門

偏差與方差， 欠擬合與過擬合

前言

泛化能力[1]

欠擬合與過擬合

偏差與方差 -- bias 與 variance [2]

偏差與方差的權衡

通過學習曲線來判斷偏差與方差

如何降低偏差[2]

如何降低方差[2]

Reference

為什麼softmax很少會出現[0.5，0.5]？

人工智慧領域裡的Interpretability和Explainability有什麼區別嗎？

如何自學《模式識別與機器學習》這本書？

有哪些非黑箱的機器學習模型，或者預測演算法？

ACL 2019將會有哪些值得關注的論文？

如果不從事機器學習，人工智慧，大數據這塊，未來還有機會在互聯網賺錢養家嗎？本人三本院校軟體專業。？

新手如何上手機器學習？

本人碩一小白，最近找課題，想問問深度學習GAN這個方向有哪些具有實際應用價值還好發文章的課題?

為什麼batch_size 增大會增加每一步的運算時間？

經典Python入門書籍都是python2.x, 先學這些再轉3.x難不難？

深度學習如何解決低信噪比下的檢測識別問題？

在2019年，使用AMD顯卡是否相當於告別深度學習，未來CUDA在機器學習領域的壟斷有可能被打破嗎？

在深度學習領域，預訓練有一定作用的本質原因是什麼？

小領域知識圖譜應該怎麼構建？

李宏毅 吳恩達誰的課更好?

熱門新聞

週熱門

偏差與方差，欠擬合與過擬合

李宏毅吳恩達誰的課更好?