1.介紹

Localization依然有很多應用前景,detection需要大量的localization標註,費時費力。弱監督方法使得localization具有很好的泛化性。

本文提出一種弱監督localization的方法,聯繫feature maps和物體的ROI區域。圖片的每一個patch都能預測一些可能的類別。

本文的貢獻:

  • 弱監督的方法解決定位問題
  • 本文的方法顯式的利用feature map與object localization的聯繫

2.方法

2.1.網路結構

AlexNet 先用ImageNet pre-train,替換最後一層,分別在COCO和VOC上finetune.

其中,分類loss使用binary cross entropy函數,因為COCO和VOC的圖片是多類別的。這裡利用物體co-occurrence信息提高分類性能。

2.2.定位

插值與搜索

搜索:當前box 分解為4個child boxes

插值:每一個child boxes對應的feature map 插值成原來的size,再進行分類找local max score box

beam search

top M & threshold

3.總結

(1)弱監督方法,只使用了image level label

(2)用Feature map自帶的activation信息選擇適當的patch


推薦閱讀:
相关文章