台湾 || 语言: 大陆简体港澳繁體台灣正體

F-Principle：初探理解深度學習不能做什麼

雪花臺灣 2019-08-04 05:20

作者丨許志欽、張耀宇

學校丨紐約大學阿布扎比分校博士後、紐約大學庫朗研究所訪問學者

研究方向丨計算神經科學、深度學習理論

近些年來，隨著深度學習在眾多實際應用中取得成功，在越來越多的科學領域內，研究人員開始嘗試利用深度學習來解決各自領域的傳統難題。和深度學習已獲得成功的問題（比如圖像分類）相比，許多科學領域內的問題往往有完全不同的特性。

因此，理解深度學習的適用性，即其能做什麼尤其是不能做什麼，是一個極為重要的問題。比如設計演算法的時候，它可以幫助我們考慮是完全用深度學習來代替傳統演算法，還是僅在這個問題中的某些步驟用深度學習。

為了探討這個問題，我們首先來看下面這個例子。在下面兩組圖中，左組中的每張圖和右組有什麼差別呢？

▲ 左邊：數據集/DNN的Fourier變換在一個特定高維頻率方向的變化曲線，右圖：左圖中黑色頻率點處的相對誤差與訓練步數的關係，紅色表示相對誤差小。第一行是MNIST數據集的結果，使用全連接tanh網路。第二行是CIFAR10數據集的結果，使用ReLU-CNN網路。

▲ 左邊：數據集/DNN的Fourier變換在一個特定高維頻率方向的變化曲線，右圖：左圖中黑色頻率點處的相對誤差與訓練步數的關係，紅色表示相對誤差小。第一行是MNIST數據集的結果，使用全連接tanh網路。第二行是CIFAR10數據集的結果，使用ReLU-CNN網路。

相關文章