目前該文章Learning Discriminative Features with Multiple Granularities for Person Re-Identification 在行人再識別的Market-1501數據集上,單張檢索的rank-1達到了95.7(without re-ranking),mAP達到了86.9.

文章的做法,主要是結合全局特徵和局部特徵,獲得更加具有描述力的特徵,整個網路框架主要分為3個支路,論文框架如下圖所示:

該框架主幹網路是ResNet-50,框架共有3個分支,一個是全局分支,兩個是局部分支,在ResNet-50的res_conv4_2產生出3個分支。

(1)對於全局分支,在res_conv5_1上下採樣,步長為2的卷積層。經過 global max-pooling,以及一個用來降維的1*1卷積層,特徵從2048維降到256維。2048維特徵去做softmax loss,256維特徵去做triplet loss。

(2)對於兩個局部分支,操作方法相同,只是第一個局部分支分成兩塊,第二個局部分支分成3塊,在res_conv5_1為了保留原來的局部特徵信息,並沒有進行下採樣,在水平方向均等的分成幾塊,後面的處理和全局分支一樣,2048維依然去做softmax loss,256維特徵去做triplet loss。

(3)在測試階段,特徵是所有256維特徵的級聯。

(4)損失函數主要是分類的softmax損失和用於度量學習的三元組損失。

若對此文章有所理解錯誤,希望大家可以指點出來,歡迎大家進行交流。

推薦閱讀:

相關文章