讓我們重新回顧行人重識別問題:從安防行業應用發展來看,行人重識別問題可以追溯到行人檢測(Pedestrain Detection),使用的是一套冷兵器時代的技術HOG+SVM, DPM。檢測到行人後自然要有行人屬性分析,按照安防視頻結構化的一貫思路,於是乎就有帽飾發形發色、性別、臉型是否戴眼鏡、上下衣顏色款式、是否騎行等等一堆屬性信息,這些屬性點在刑偵等應用中有點作用,加個時空限制條件能過濾到一部分嫌疑人,但是數據量上來後就沒什麼卵用。當然,分析粒度有限,從技術的角度看,能實現這些功能說明你技術比較挫。於是乎為了高大上,圖像檢索的一些演算法被引進,CNN出現之後更是各種Loss(Metric Learning)滿天飛。人臉識別方向以發論文為生的人的應該一直很苦逼,完備的測試集在,沒有真正提升的技術很難灌水。重識別問題讓他們找到了灌水的入口。

在深度學習如日中天的當下,如何才能體現個人和公司的牛逼之處呢,大致有如下幾種方法:A.做出牛逼的產品;B.發表牛逼的論文; C.刷榜; D.發專利;E.清談扯蛋寫PPT。

做出牛逼的產品太難了,大多數人集中於後幾項。

行人識別問題區別於車輛識別,如下圖對比:

視頻監控視角下,車輛有唯一的身份識別信息車牌,行人的唯一識別信息是人臉。行人重識別的基本假設是人臉信息獲取不全,希望在形體特徵方面提取信息進行識別,在此基礎上建立的技術很快就會到達其預設的天花板。

行人重識別問題難度要低於行人識別,或者說行人識別太難當前只能做行人重識別。所以,行人重識別的定位決定了其技術能達到的上限。 個人以為當前行人重識別存在如下問題:
  1. 數據集:當前數據集太小,大的也不過數千人。試想如果我能收集幾萬人(不是幾萬張)在多個攝像機下的視頻序列,這樣的評測纔有說服力。 從另一個角度,搭建環境收集一批數據,即便使用最簡單的分類模型,即可秒殺大部分論文效果。
  2. 數據本身:安防高清相機下拍攝的行人和電商文案模特圖的清晰度是不一樣的。專業刑偵人員可以辨識原始視頻畫面中寬度為32像素的嫌疑人,而演算法卻很難。
  3. 服飾信息影響:同一個行人,在忽略其形體生長特徵以外,不同季節,不同時段的衣著信息是不同的;不同的行人,同一時空下服飾相似性太大;試想,冬天時大片黑色厚外套衣服,只是身形不同,重識別效果有限。
  4. 形體變化影響特徵描述,或者嘗試基於序貫圖像的描述方法;
  5. 行人對齊:引入人臉識別的那一套做法,否則行人識別問題沒法繼續搞下去了。
  6. 應用:重識別問題定位於此,也只能到此了。「給我一個人的圖像Query,我能找著看Gallery中誰和他長得像,但我不知道是不是他。」
行人重識別:「Hi, Query,我在Gallery中找到一個人,和你要的賊像!」

推薦閱讀:

相關文章