一篇不錯的行人檢測文章

來自專欄物體檢測隨筆7 人贊了文章

最近看了一篇CVPR2016年的行人檢測文章How Far are We from Solving Pedestrian Detection?距離現在兩年，算是老文章了。

這篇文章分析問題的思路非常清晰、細緻，我覺得蠻值得借鑒的。這種清晰和細緻的背後，一方面是嚴謹的科研態度，另一方面是對行人檢測問題的深入理解。

文章對當前sota的檢測器在caltech行人測試集上的failure case進行分析，failure case主要有兩類，一類是false positive，一類是false negative。

false positive來源的原因分析如下圖，主要有9個來源，9個來源又被歸為三類原因：定位不準、背景、標註錯誤。定位不準的問題文章認為來自於訓練集標註的框不準，於是文章重新標註了一遍數據集，最後實驗下來發現提高訓練集標註框的精度的確有助於提高檢測器的效果。而背景問題也是行人檢測裡邊的老大難問題，比如路邊的指示牌、車後面的方向燈、樹葉等等都可能被識別為行人，現在也沒啥好的解決方法。

false positive來源分析

背景被檢測為行人示例1

背景被檢測為行人示例2

false negative來源的原因分析如下圖，主要有6個來源。其中尺寸小和遮擋是眾所周知的難題。而side view和cyclists，文章認為是由於訓練集裏這兩類情況表達不足，也就是訓練集裡邊這類情況比較少，解決這種問題的最好方法是在訓練集中增加對應圖片。對於尺寸小的問題，文章又進一步分析，尺寸小的行人包含三種問題：模糊不清、像素點少、對比度差，經過實驗，文章發現像素點少纔是尺寸小的行人容易出現false negative的原因。