台湾 || 语言: 大陆简体港澳繁體台灣正體

理解基於區域的物體檢測模型

雪花臺灣 2019-07-17 04:18

本文是物體檢測系列文章的第一部分，即理解基於區域的物體檢測模型工作原理，個人認為本文講解地比較透徹，通過翻譯也是一個進一步消化吸收的過程。如有翻譯不當之處，請批評指正。

【譯自】：https://medium.com/@jonathan_hui/what-do-we-learn-from-region-based-object-detectors-faster-r-cnn-r-fcn-fpn-7e354377a7c9

在這個系列中，我們將嘗試深入理解物體檢測任務。第一部分我們將介紹基於區域的物體檢測模型，包括Fast R-CNN，Faster R-CNN，R-FCN以及FPN。第二部分我們將學習單次檢測模型。第三部分我們將討論性能以及一些實現上的問題。通過學習本文，我們將學習內部工作原理，注意事項以及改善點。通過這些能夠更加深入地理解物體檢測任務。

第一部分：理解基於區域的物體檢測模型工作原理（Faster R-CNN, R-FCN, FPN）
第二部分：理解單次檢測模型工作原理（SSD,YOLO）,FPN以及Focal loss
第三部分：設計建議和經驗，物體檢測的發展方向

滑動窗口檢測器

自從AlexNet贏得了2012年ILSVRC挑戰賽的冠軍，CNN在圖像分類領域處於主宰地位。物體檢測任務的一個最暴力的方法就是從左到右、從上到下的滑動窗口，在每個窗口做分類任務。為了在不同的視角和距離檢測物體種類，會使用不同尺寸和縱橫比的窗口。

滑動窗口，從左到右，從上到下

滑動窗口，從左到右，從上到下

相關文章