台湾 || 语言: 大陆简体港澳繁體台灣正體

如何評價deeplab v3+？

雪花臺灣 2020-10-09 10:22

如何評價deeplab v3+

3+繼承了該系列論文一貫的嚴謹作風，對各種改進和技巧都做了控制變數實驗，以Google無限的算力給大家展示了煉丹的各種可能性，幫大家踩坑，值得稱讚。

論文創新主要在於改進的backbone網路，和引入decoder進一步提高上採樣的準確度，最後的實驗結果也確實顯示了新Xception結構的優勢，並在各個數據集上實現了STOA。最難能可貴的是對於各種不work的場景，作者非常坦誠的給大家羅列了出來。

好了表揚的部分說完了現在開始純主觀無理性胡攪蠻纏的吐槽部分了，請大佬們迴避。

如果說3代開啟了面向測試集設計evaluation（多尺度，翻轉，降低OS），那3+代就是已經開啟了面向測試集設計網路了。3代花了大量篇幅討論的image level feature，結果到了CS測試集上反而跌了不少，所以rethinking出來的global context information是隻針對VOC的？
Decoder的回歸刷高了不到1%的miou，卻成了全文最大的賣點，這不是回到FCN的老路，啪啪打1代的臉嗎？不過該系列倒是一貫堅持每一代打上一代臉。
到3代的時候，作者花了三年基本上把自己空洞卷積金字塔和dense feature的故事講圓了，1代2代一些錯誤設計到3代基本上也都糾正。但這個3+，我覺得可能作者自己也不好意思再自稱4代了，畢竟前面每一代至少還有一些真正的創新點，這次更像一個實驗報告了。

總之，deeplab系列在3代達到巔峯，也算是可以收場了，再把各種別人的花樣往這套系統裏揉的話，可能更適合發做一個tech report吧。這麼小的提高下，還是面向測試集設計的網路，我覺得工程上的意義也不太大，resnet deeplab v3就夠了。

想對樓上的同學說，看了我們的源碼後你會覺得畢設壓力小更多

PaddlePaddle/models?

github.com

DeepLab v3+ 是DeepLab語義分割系列網路的最新作，其前作有 DeepLab v1，v2, v3, 在最新作中，Liang-Chieh Chen等人通過encoder-decoder進行多尺度信息的融合，同時保留了原來的空洞卷積和ASSP層，其骨幹網路使用了Xception模型，提高了語義分割的健壯性和運行速率。其在Pascal VOC上達到了 89.0% 的mIoU，在Cityscape上也取得了 82.1%的好成績，下圖展示了DeepLab v3+的基本結構4：

相關文章