【AI初識境】如何增加深度學習模型的泛化能力(L1/L2正則化，dropout，數據增強等等)

這是專欄《AI初識境》的第9篇文章。所謂初識，就是對相關技術有基本了解，掌握了基本的使用方法。

今天來說說深度學習中的generalization問題，也就是泛化和正則化有關的內容。

作者&編輯 | 言有三

1 什麼是generalization

機器學習方法訓練出來一個模型，希望它不僅僅是對於已知的數據(訓練集)性能表現良好，對於未知的數據(測試集)也應該表現良好，也就是具有良好的generalization能力，這就是泛化能力。測試集的誤差，也被稱為泛化誤差。

舉個例子來說，我們在ImageNet上面訓練分類模型，希望這個模型也能正確地分類我們自己拍攝的照片。

在機器學習中，泛化能力的好壞，最直觀表現出來的就是模型的過擬合(overfitting)與欠擬合(underfitting)。

過擬合和欠擬合是用於描述模型在訓練過程中的兩種狀態，一般來說，訓練會是這樣的一個曲線。下面的training error，generalization error分別是訓練集和測試集的誤差。