論文筆記系列-NAS With Reinforcement Learning

摘要

神經網路在多個領域都取得了不錯的成績，但是神經網路的合理設計卻是比較困難的。在本篇論文中，作者使用 遞歸網路去省城神經網路的模型描述，並且使用 增強學習訓練RNN，以使得生成得到的模型在驗證集上取得最大的準確率。

在 CIFAR-10數據集上，基於本文提出的方法生成的模型在測試集上得到結果優於目前人類設計的所有模型。測試集誤差率為3.65%，比之前使用相似結構的最先進的模型結構還有低0.09%，速度快1.05倍。

在 Penn Treebank數據集上，根據本文演算法得到的模型能夠生成一個新穎的 recurrent cell,其要比廣泛使用的 LSTM cell或者其他基線方法表現更好。在 Penn Treebank測試集上取得62.4的perplexity，比之前的最好方法還有優秀3.6perplexity。這個 recurrent cell也可以轉移到PTB的字元語言建模任務中，實現1.214的perplexity。