CVPR2019 語義分割之教師知識提取

Structured Knowledge Distillation for Semantic Segmentation

https://arxiv.org/pdf/1903.04197.pdf?

arxiv.org

１、論文出發點

　　在深度學習走嚮應用的過程中，不可避免的要考慮到效率問題，複雜網路雖然效果好，但效率低，反之輕型網路效率高，但精度差。所以現在冒出來了這樣一種思路：利用複雜網路所學知識去指導輕型網路，使得輕型網路不僅可以有好的效率，還可以達到大型網路的精度。此篇論文就是這樣的一篇文章。ＣＶＰＲ２０１９有好幾篇這樣的文章（例如下面這篇）。值得注意的兩篇一作都來自阿德萊德大學。

Knowledge Adaptation for Efficient Semantic Segmentation

https://arxiv.org/pdf/1903.04688.pdf?

arxiv.org

２、論文怎麼做的

　　在此篇論文語義背景下，所謂知識提取：就是從大型網路中提取學到的好的知識用於指導緊湊型網路的訓練。所以知識提取相關的文章都會涉及到一個teacher網路，一個student網路。所以知識提取的核心思想歸結為：學生所學，一切向老師看齊。

　　那麼這篇論文中作者是怎樣使得學生向老師看齊的。

　　１、首先，像素分類看齊。

　　　將重型網路像素級分類作為軟標籤（為方便理解：one-hot label為硬標籤），訓練緊湊型像素級分類，使得緊湊型網路分類輸出與重型網路看齊。