一個更加強力的ReID Baseline
這個專欄是曠視科技北京研究院Video Team對外分享與交流的欄目,主要由Team leader @張弛 、AlignedReID作者 @zhangxuan,PCB論文作者 @孫奕帆 、Pytorch教程書作者廖星宇 @Sherlock 以及 @羅浩.ZJU 等人維護。如果有興趣加入Video Team可以把簡歷發給[email protected],具體方向包括但不限於ReID、Tracking、Activity Recognition、GAN以及網路壓縮等等。第一期文章介紹我上個月做的一個工作,是一個非常強力的ReID Baseline,這個工作也被CVPR2019的TRMTMCT Workshop接收。
Bag of Tricks and A Strong Baseline for Deep Person Re-identification
1、前言
行人重識別最近兩三年發展十分迅速,每年都以10~15%的Rank1準確度在增長。當然快速發展的背後離不開Baseline的逐漸提高。早期的Baseline還比較低,大部分工作都在很低的Baseline上完成,因此準確度不高。而2017~2018這個時期,隨著Pytorch框架的崛起,很多學者基於Pytorch框架開始調ReID的Baseline,因此性能也就越來越強(很多博士和博士生都做出了巨大貢獻)。2018年暑期我和廖星宇師弟在曠視實習的時候,開源過一個GitHub項目,並且發布一篇知乎文章:
Sherlock:一個強力的ReID basemodel基於這個項目,我們最近這個項目進行擴展,完成一個更加強力的ReID Baseline。通過引入一些低消耗的訓練Tricks,使用ResNet50的Backbone,這個Baseline在Market1501可以達到94.5%的Rank1和85.9%的mAP。當然使用更深的Backbone還可以繼續提高性能。值得一提的是,和大量拼接多個local feature的方法取得高準確度的方法不同,我們只使用了一個global feature。目前代碼已經開源了,歡迎學術界和工業界使用這個Baseline進行論文和產品的研究,comments are welcome!
michuanhaohao/reid-strong-baseline2、背景
Baseline對於一個領域的研究起著非常重要的作用,但是我們觀察最近一年頂會發表的ReID工作,發現論文之間Baseline的差距特別大。以Market1501為例,極少數工作在90以上的Baseline上開展,而大部分集中在80~90之間,甚至部分工作在80以下的Baseline上開展。而DukeMTMC-ReID更是沒有一個Baseline超過了80的Rank1。我們都清楚,在低的Baseline上面方法漲點更加容易。另外不同的Baseline也很難統一比較不同方法的優劣性。基於這個因素考慮,我們覺得需要統一一個強力的Baseline。