我們經常聽到的一條信息是「深度學習只有在擁有大量數據時纔有意義」。當然,深度學習需要能夠從數據中自動學習特徵,這通常只有在有大量訓練數據可用時纔有可能 ,特別是對於輸入樣本非常高維的問題,如圖像。然而,卷積神經網路 —— 深度學習的支柱演算法 —— 是大多數「感知」問題(例如圖像分類)的最佳模型之一,即使只有很少的訓練數據,依然可以訓練一個不錯的模型,而不需要任何自定義特徵工程。
更重要的是,深度學習模型本質上是高度可再利用的:例如,您可以採用在大規模數據集上訓練的圖像分類或語音到文本模型,然後在一個不同的任務重複使用它,只需進行微小的更改,如我們將在這篇文章中看到。特別是在計算機視覺的任務中,許多預先訓練的模型(通常在ImageNet數據集上訓練)現在可以公開下載,並且可以用於從非常少的數據中推導強大的視覺模型。