[ECCV 2016] Weakly Supervised Localization Using Deep Feature Maps

1.介紹

Localization依然有很多應用前景，detection需要大量的localization標註，費時費力。弱監督方法使得localization具有很好的泛化性。

本文提出一種弱監督localization的方法，聯繫feature maps和物體的ROI區域。圖片的每一個patch都能預測一些可能的類別。

本文的貢獻：

2.方法

2.1.網路結構

AlexNet 先用ImageNet pre-train，替換最後一層，分別在COCO和VOC上finetune.

其中，分類loss使用binary cross entropy函數，因為COCO和VOC的圖片是多類別的。這裡利用物體co-occurrence信息提高分類性能。

2.2.定位

插值與搜索

搜索：當前box 分解為4個child boxes

插值：每一個child boxes對應的feature map 插值成原來的size，再進行分類找local max score box

beam search

top M & threshold

3.總結

(1)弱監督方法，只使用了image level label

(2)用Feature map自帶的activation信息選擇適當的patch

第一人稱3D恐怖解謎遊戲《紙人：起源》登上Switch平台