在細粒度圖像領域也有few-shot的需求,在傳統的fine grained不管是檢索還是識別也好,依賴的數據是非常大的,甚至是海量的標註數據,這樣的海量標註數據,fine grained僅僅依靠普通人標註是不行的,由於標註量和成本都是非常大的,所以在fine grained未來的發展上,我們覺得像few-shot這樣的場景非常重要,few-shot能使用訓練數據非常有限,fine grained也會非常難,針對這樣的問題我們提出了一個solution。(few-shot fine-grained(fsfg)image recognition)

上圖中的灰色區域在Meta-learning叫做episode,在episode僅僅依靠兩個examplar,意思是只有兩張圖告訴你圖中說什麼東西,告訴系統白色的鳥叫做1,綠頭鴨叫2,要做的說通過one shot來evahuation data中的圖像進行識別。

在整個模型訓練的時候,我們設計了一個Meta-learning的fashion

。他們藉助一個輔助數據集進行類別與圖像的採樣,在測試集上做few shot的任務。基於這個輔助數據集,構造出若干類似於上圖中測試數據的episode。系統通過對每個episode的樣本進行學習,可以得到一些分類器或者是特徵向量,進而可以在evaluation data上產生loss。藉助這種方法,系統可以學習到一個在測試數據集上泛化能力較好的網路。

在我們的方法中,在exemplar中學習到學習到一個映射,映射的對象就是輸入圖像所屬類別的分類器(classifier)。當系統學習到classifier以後,便可以對evalutation data進行分類。

在FSFG框架中,提出了一個基於Bilinear CNN的方法,通過它,系統可以隱性的學到輸入圖像的一些part信息,進一步,這些part所對應的sub-vector可能就與物體細粒度層面的一些keyparts相關。

我們提出分別對這些sub-vector進行分段映射,分段映射所對應的便是那些子分類器(sub-classifier)。通過將這些子分類器進行級聯,就可以學到有關整個物體的分類器。

最後,研究人員將習得的模型在3個主流的細粒度圖像數據集(CUB Birds、Stanford Dogs、Stanford Cars)上進行了性能驗證,發現其達到了目前最先進的水平。

最後在3個細粒度圖像數據集(CUB Birds、Stanford Dogs、Stanford Cars)上進行了實驗驗證

顯著好於其他所有的方法,

上圖是可視化的結果。

(全文完)

其他篇章參看:

飄哥:深度學習: 細粒度圖像識別與分析系列學習筆記(三)ddt方法?

zhuanlan.zhihu.com圖標飄哥:深度學習: 細粒度圖像識別與分析系列學習筆記(二)scda方法?

zhuanlan.zhihu.com
圖標
飄哥:深度學習: 細粒度圖像識別與分析系列學習筆記(一)?

zhuanlan.zhihu.com
圖標
飄哥:深度學習: 細粒度圖像識別與分析系列學習筆記(四)scda和ddt方法比較?

zhuanlan.zhihu.com
圖標
飄哥:深度學習: 細粒度圖像識別與分析系列學習筆記(五)?

zhuanlan.zhihu.com
圖標

推薦閱讀:

相关文章