首發於《有三AI》
【技術綜述】萬字長文詳解Faster RCNN源代碼?mp.weixin.qq.comFaster R-CNN將分成四部分介紹。總共有Faster R-CNN概述,py-faster-rcnn框架解讀,網路分析,和訓練與測試四部分內容。第一篇將介紹Faster R-CNN概述。下一篇可以詳見【技術綜述】萬字長文詳解Faster RCNN源代碼(二)。
1. Faster R-CNN概述
1.1 基礎
目標檢測任務關注的是圖片中特定目標物體的位置。一個檢測任務包含兩個子任務,其一是輸出這一目標的類別信息,屬於分類任務。其二是輸出目標的具體位置信息,屬於定位任務。
分類的結果是一個類別標籤,對於單分類任務而言,它就是一個數,對於多分類任務,就是一個向量。定位任務的輸出是一個位置,用矩形框表示,包含矩形框左上角或中間位置的x,y坐標和矩形框的寬度高度。