CVPR2019 弱監督語義分割之利用標籤填充率忽略非信心區域
Box-driven Class-wise Region Masking and Filling Rate Guided Loss for Weakly Supervised Semantic Segmentation
https://arxiv.org/pdf/1904.11693.pdf一、論文出發點
由於論文的弱監督是利用邊界框標記,而不是圖像級標記,所以論文的總出發點就在於,1怎樣利用bounding box去生成更好的偽像素級標籤,
2以及怎樣合理利用這個偽標籤去訓練模型:考慮到偽標籤中的一些錯誤標記區域對訓練帶來的負面影響,怎麼忽略這些錯誤標記區域了?
Note that the wrongly labeled regions of the pixel-level proposals have negative effects on model training, recognizing the negative regions will be helpful.
二、論文核心思想
論文的baseline: 利用非監督的CRF將bounding box 轉換成像素級標籤,由於不是論文的主要創新,這裡不過多講;
論文基於上述粗糙像素級標籤,做了兩個創新。
1:基於BOX標記的類mask生成。也就是文中的BCM。
該創新的核心思想:利用box標記,利用最小二乘,為每個類單獨訓練一個二值attention map生成網路,然後將該attention map與空間特徵相乘,使得空間特徵帶有class region attention信息。