[AAAI2019]時空相互促進的視頻行人重識別

最近看了兩篇 Video-based 的 ReID 文章，做下筆記簡單對比下：

第一篇CVPR2018 [1]：先對每幀的深度特徵進行 空間Attention，讓網路自主發現對分類任務更有幫助的人體parts；然後對每Part各自進行多幀 時間Attention，讓網路自動評價每幀中的parts特徵的質量好壞（如下圖最後一行 SK，網路關注的part=黑色小包包區域，對於第1幀，全被遮擋，質量權值為0）