DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation
擬解決問題:
- 隨著5G、移動互聯網等技術的告訴發展,在計算力受限的設備上進行實時語義分割任務成為了當前重要的需求。當面對高解析度的圖像輸入時,傳統的卷積網路很難再運算量與速度之間產生權衡,因此如何在不影響效果的前提下設計出具有較小運算量的分割模型成為了一個難題。
- 一些工作通過限制輸入圖像大小或修剪網路中的冗餘信道來提高推理速度,從而降低了計算複雜度。雖然這些方法似乎很有效,但它們很容易丟失邊界和小物體周圍的空間細節。此外,淺層的網路削弱了特徵辨別能力。
- 主流語義分割架構中,金字塔型特徵圖融合方法如空間金字塔池化能夠使用淺層的語義信息增強特徵,從而降低計算量,但是多數方法特徵圖的增強是在一個分支的輸出上,沒能充分利用之前的特徵
為瞭解決上述問題,作者提出了DFANet模型,由於深度可分離卷積被證明是實時推理中最有效的操作之一,因此作者採用輕量級網路作為骨幹結構。
在介紹具體的模型之前,作者提出了傳統的機構總是從單路徑框架即一層層的向下抽取出最後的特徵映射,這種方法中往往會丟失上一層中的空間細節和語義信息,為了提高模型的學習能力並同時增加接受領域,作者才用了特徵重用的思想。作者設計的結構與傳統結構的對比如下: