台湾 || 语言: 大陆简体港澳繁體台灣正體

Fast R-CNN：變快了，也變強了 || 5分鐘看懂CV頂刊論文

雪花台灣 2019-05-14 14:30

關於R-CNN：Uno Whoiam：R-CNN：狼入羊群 || 5分鐘看懂CV頂刊論文
原論文鏈接：Fast R-CNN

Fast R-CNN 即 Fast Region-based Convolutional Network，你的直覺沒錯，它就是R-CNN的升級版。

在細說 Fast R-CNN 之前，不妨先看看 R-CNN 有什麼令人詬病的地方：

1、慢，實在是慢，別說實時檢測了，47s的等待讓坐在電腦前的記幾彷彿是一隻智障。

2、訓練麻煩，AlexNet、SVMs 以及 bounding-box regression 得一個接一個地訓練。

3、訓練佔用大量時間和空間（硬碟），除開訓練三個模型的時間，SVMs 和 bounding-box regression 的訓練樣本得用 AlexNet 一次又一次地前向傳播提取特徵、標註樣本數據、保存在硬碟里的喲，每一張圖片的每一個proposal都得跑一次喲，想想都覺得噁心。而作者而說明了，需要GPU花2.5天的時間才能處理完5K張VOC07trainval里的圖片，產生的訓練樣本佔用的空間得好幾百個GB。想想都覺得噁心嘔。順便溫馨提示一下，每張圖生成的樣本最好單獨生成一個文件夾保存，別把這這個數量級的樣本放在同一個文件夾里喲，即使是最好的SSD也招架不住這樣的文件夾，當你幡然醒悟想要rm -r -f dir 重新來過時，漫長的等待足夠讓您好好睡一覺了，別問我為什麼知道這麼多淚目。

隨著 Fast R-CNN 的到來，以上問題也就不復存在辣！相比 R-CNN，除了各種快（見下段原論文引用）Fast R-CNN 有以下幾個特性：

Fast R-CNN trains the very deep VGG16 network 9× faster than R-CNN, is 213× faster at test-time, and achieves a higher mAP on PASCAL VOC 2012. Compared to SPPnet, Fast R-CNN trains VGG16 3× faster, tests 10× faster, and is more accurate.

1、更高的mAP。

2、不用分段訓練，整個網路可以通過使用多任務損失函數，一次性訓練好。

3、訓練可以更新網路層中的所有權重。

4、無需苦逼生成訓練樣本緩存在硬碟上，節省了空間。

Fast R-CNN 的整體網路如下圖所示：

SmoothL1

S:CaffeNet — SmoothL1

相关文章