一個更加強力的ReID Baseline

這個專欄是曠視科技北京研究院Video Team對外分享與交流的欄目，主要由Team leader @張弛、AlignedReID作者 @zhangxuan，PCB論文作者 @孫奕帆、Pytorch教程書作者廖星宇 @Sherlock 以及 @羅浩.ZJU 等人維護。如果有興趣加入Video Team可以把簡歷發給[email protected]，具體方向包括但不限於ReID、Tracking、Activity Recognition、GAN以及網路壓縮等等。第一期文章介紹我上個月做的一個工作，是一個非常強力的ReID Baseline，這個工作也被CVPR2019的TRMTMCT Workshop接收。

Bag of Tricks and A Strong Baseline for Deep Person Re-identification?

arxiv.org

1、前言

行人重識別最近兩三年發展十分迅速，每年都以10~15%的Rank1準確度在增長。當然快速發展的背後離不開Baseline的逐漸提高。早期的Baseline還比較低，大部分工作都在很低的Baseline上完成，因此準確度不高。而2017~2018這個時期，隨著Pytorch框架的崛起，很多學者基於Pytorch框架開始調ReID的Baseline，因此性能也就越來越強（很多博士和博士生都做出了巨大貢獻）。2018年暑期我和廖星宇師弟在曠視實習的時候，開源過一個GitHub項目，並且發布一篇知乎文章：

Sherlock：一個強力的ReID basemodel?

zhuanlan.zhihu.com

基於這個項目，我們最近這個項目進行擴展，完成一個更加強力的ReID Baseline。通過引入一些低消耗的訓練Tricks，使用ResNet50的Backbone，這個Baseline在Market1501可以達到94.5%的Rank1和85.9%的mAP。當然使用更深的Backbone還可以繼續提高性能。值得一提的是，和大量拼接多個local feature的方法取得高準確度的方法不同，我們只使用了一個global feature。目前代碼已經開源了，歡迎學術界和工業界使用這個Baseline進行論文和產品的研究，comments are welcome！

michuanhaohao/reid-strong-baseline?

github.com

2、背景

Baseline對於一個領域的研究起著非常重要的作用，但是我們觀察最近一年頂會發表的ReID工作，發現論文之間Baseline的差距特別大。以Market1501為例，極少數工作在90以上的Baseline上開展，而大部分集中在80~90之間，甚至部分工作在80以下的Baseline上開展。而DukeMTMC-ReID更是沒有一個Baseline超過了80的Rank1。我們都清楚，在低的Baseline上面方法漲點更加容易。另外不同的Baseline也很難統一比較不同方法的優劣性。基於這個因素考慮，我們覺得需要統一一個強力的Baseline。