NIPS 2018 | 行人重識別告別輔助姿勢信息，商湯、中科大提出姿勢無關的特徵提取GAN

選自arXiv，作者：Yixiao Ge、Zhuowan Li、Haiyu Zhao等，機器之心編譯，參與：李詩萌、張倩。

行人圖像的姿勢變化是行人重識別（reID）任務中的重要挑戰之一。本文提出了一個 reID 新框架——FD-GAN，來學習與身份相關而與姿勢無關的表徵，用於姿勢不同的行人重識別。與現有的對齊或基於區域的學習方法相比，該框架不需要額外的輔助姿勢信息和計算成本，在三個廣泛使用的行人重識別數據集中都取得了當前最優結果。

引言

行人重識別（reID）是一項極具挑戰性的任務，該任務以在多個攝像頭拍攝出來的圖像中識別相同行人為目標。隨著深度學習方法的廣泛使用，reID 的性能藉助不同的演算法得到快速提高。在用深度神經網路學習表徵的問題上大家做了各種嘗試，但姿勢變化、圖像模糊以及目標遮擋等問題仍對學習判別式特徵提出了巨大的挑戰。解決這些問題有兩類方法，對齊行人圖像 [1] 或通過學習身體區域的特徵整合行人的姿勢信息 [2]。但這些工作在推斷階段也需要輔助的姿勢信息，這樣就限制了演算法在沒有姿勢信息的情況下泛化新圖像的能力。與此同時，由於對姿勢估計的推斷更複雜了，計算成本也隨之增加。

在圖像生成方面，生成式對抗網路（GAN）受到了越來越多的關注。近期，也有一些工作將 GAN 的潛力用在現有的 reID 演算法中。Zheng 等人 [3] 提出一個半監督架構，利用離羣值的標籤平滑正則化（LSRO）學習生成的圖像。還有用於彌合不同數據集間領域差距的 PTGAN[4]。除了圖像合成，GAN 也可以用在表徵學習中。我們在本文中提出了一個身份相關的新表徵學習框架，來實現魯棒的行人重識別。

本文提出的特徵提取生成式對抗網路（FD-GAN）在姿勢改變的情況下還能保持身份特徵的連續性（如圖 1 所示），但推斷複雜性並沒有增加。該架構採用了 Siamese 架構學習特徵。每一個分支中都有一個圖像編碼器和圖像生成器。圖像編碼器輸入給定輸入圖像中的行人視覺特徵。圖像生成器根據姿勢信息和編碼器中輸入的行人特徵生成了新的行人圖像。框架中集成了多個判別器，分辨通過兩個分支生成的圖像之間的分支內和分支間關係。