7分鐘如何用CNN模型與sliding window完成對大圖片中小物體的尋找並分類

如何用CNN模型+sliding window完成對大圖片中小物體的尋找並分類？

大體工作流程

將大圖切分成各種比例尺寸的小圖（希望能剛好框住物體）
用大量小圖訓練一個具備物體分類能力的CNN

將切分好的小圖餵給CNN模型來做分類，給出識別物體的概率值

實際問題1

比例尺寸太多，stride太小，切分的圖片太多，計算量太大，訓練效率低下；
比例尺寸過少，stride過大，切分圖片稀疏，會錯過重要區域，準確率下降；

實際問題2

CNN處理圖片時，如果最後FC的neurons很多400個，計算量過大；

方案

將FClayer轉變為Conv-layers（5x5 conv, 1x1 conv), 同樣大小的feature maps 400 channels，計算量要少很多;

實際問題3

訓練好的具備分類能力的CNN所用的圖片大小是固定的（14x14x3)，但要處理的新圖片都會大於訓練圖片尺寸如16x16x3, 28x28x3，如果新圖片全部切分成14x14x3小圖片，圖片太多，一張一張圖片單獨訓練，計算量太大；

方案

不切分，直接訓練，不同之處就是輸出的output不再是1x1x4, 而是2x2x4, 8x8x4, 相當於一次完成4張小圖，一次完成8張小圖的計算

7分鐘如何用CNN模型與sliding window完成對大圖片中小物體的尋找並分類

探索一句話版的機器學習與深度學習_嗶哩嗶哩 (゜-゜)つロ乾杯~-bilibili p34