Keras-RetinaNet訓練自己的數據詳細教程

準備工作：

1、代碼開源框架使用的是 fizyr/keras-retinanet

2、Keras版本要2.2.4以上

下面進入正題。

第一部分：模型準備

（1）模型下載地址：fizyr/keras-retinanet

（2）模型安裝可以使用以下命令：

pip install numpy --user pip install . --user

安裝過程中，會檢查依賴庫，比如opencv-python，如果沒有安裝，會載入並安裝。這裡提一句，如果在安裝時某個包下載安裝不成功，自己記下來版本，比如opencv-python 3.4.5.20，可以直接先去利用pip或conda安裝，但是一定要記得對應的版本。

（3）模型編譯可以使用以下命令：

python setup.py build_ext --inplace

編譯的時候可能會出現提示，沒有某個版本C++的編譯器，我提示的時沒有2014版，把錯誤提示直接百度，就會出現解決方法，我是下載了一個3M的14版的編譯工具。（當然，最好就是有相應版本的完整C++）

第二部分：數據準備

（1）在keras-retinanet-master/keras_retinanet/文件夾下面新建一個文件夾CSV用來存放自己製作的數據集。

數據文件夾格式如下：

（2）根據官網的樣例，自己製作的Annotations數據集格式如下：

path/to/image.jpg,x1,y1,x2,y2,class_name

如果一張圖片中沒有包含任何要檢測的物體，則格式如下：

path/to/image.jpg,,,,,

一個完整的例子：

/data/imgs/img_001.jpg,837,346,981,456,cow /data/imgs/img_002.jpg,215,312,279,391,cat /data/imgs/img_002.jpg,22,5,89,84,bird /data/imgs/img_003.jpg,,,,,

下面，我就貼出自己寫的一個代碼：

def restrict_image_info(label_path): with open(label_path, r) as load_f: load_dict = json.load(load_f) image_collect = load_dict[images] image_num = len(image_collect) anno_collect = load_dict[annotations] anno_num = len(anno_collect)

img_path_list = []
x1_list = []
y1_list = []
x2_list = []
y2_list = []
category_list = []

mapper = {0: tieke, 1: heiding,
2: daoju, 3: dian, 4: jiandao}

for i in range(image_num):
img = image_collect[i]
img_name = img[file_name]
img_id = img[id]
img_height = img[height]
img_width = img[width]

for j in range(anno_num):
if anno_collect[j][image_id] == img_id:
bbox = anno_collect[j][bbox]
img_path_list.append(restrict_rele_path+img_name)
x1_list.append(int(np.rint(bbox[0])))
y1_list.append(int(np.rint(bbox[1])))
x2_list.append(
int(np.rint(bbox[0] + bbox[2])))
y2_list.append(
int(np.rint((bbox[1]+bbox[3]))))
category_list.append(anno_collect[j][category_id]-1)

anno = pd.DataFrame()
anno[img_path] = img_path_list
anno[x1] = x1_list
anno[y1] = y1_list
anno[x2] = x2_list
anno[y2] = y2_list
anno[class] = category_list
anno[class] = anno[class].map(mapper)

# anno.to_csv(CSV/annotations.csv, index=None, header=None)
train_anno, val_anno = train_test_split(anno, test_size=0.1)
train_anno.to_csv(CSV/train_annotations.csv, index=None, header=None)
val_anno.to_csv(CSV/val_annotations.csv, index=None, header=None)

其中代碼段：

train_anno, val_anno = train_test_split(anno, test_size=0.1) train_anno.to_csv(CSV/train_annotations.csv, index=None, header=None) val_anno.to_csv(CSV/val_annotations.csv, index=None, header=None)

是對圖片進行訓練集、驗證集的隨機劃分。

訓練圖片生成的數據格式如下：

data/jinnan2_round1_train_20190305/restricted/190119_184244_00166940.jpg,88,253,206,295,daoju data/jinnan2_round1_train_20190305/restricted/190119_184244_00166940.jpg,296,244,414,344,jiandao data/jinnan2_round1_train_20190305/restricted/190119_184244_00166940.jpg,231,239,299,341,jiandao data/jinnan2_round1_train_20190305/restricted/190119_184244_00166940.jpg,99,278,194,320,dian

驗證圖片生成的數據格式如下：

data/jinnan2_round1_train_20190305/restricted/190119_182957_00166754.jpg,314,237,326,265,dian data/jinnan2_round1_train_20190305/restricted/190127_100838_00177153.jpg,246,229,304,279,tieke data/jinnan2_round1_train_20190305/restricted/190119_184522_00166980.jpg,668,409,717,432,dian data/jinnan2_round1_train_20190305/restricted/190119_183142_00166782.jpg,565,326,708,432,jiandao data/jinnan2_round1_train_20190305/restricted/190127_143529_00178527.jpg,8,262,45,326,heiding

（3）根據官網的樣例，自己製作的classes數據集格式如下：

class_name,id

一個完整的例子：

cow,0 cat,1 bird,2

最後生成的數據格式如下：

tieke,0 heiding,1 daoju,2 dian,3 jiandao,4

注意：保存的csv文件是沒有頭部行的，不然後續代碼會報錯！

（4）檢查生成的數據是否合格

要進行這一步，必須先要完成第一步中模型的下載與編譯！

檢查數據可以使用以下命令：

python keras_retinanet/bin/debug.py csv keras_retinanet/CSV/train_annotations.csv keras_retinanet/CSV/classes.csv

其中第一個參數csv代表要檢查的數據是自己製作的數據集，第二個參數是train_annotations.csv對應的路徑，第三個參數是classes.csv對應的路徑。

（5）圖片存放位置

這個可以根據自己的需要定，但是最好放在上面新建的CSV文件夾下面，這個使用路徑比較方便。在我自己這個代碼中，我是在CSV文件夾下新建一個data文件夾下存放自己的圖片，此時注意與train_annotations.csv文件中的圖片路徑要一致，比如我這時候就應該是這樣：

data/jinnan2_round1_train_20190222/restricted/190119_185206_00167075.jpg,125,279,177,339,tieke data/jinnan2_round1_train_20190222/restricted/190119_185206_00167075.jpg,153,363,238,549,daoju

（6）關於模型的圖片輸入尺寸

在https://github.com/fizyr/keras-retinanet/blob/master/keras_retinanet/bin/train.py中的409、410行有設置輸入的默認參數（800*1333）：

parser.add_argument(--image-min-side, help=Rescale the image so the smallest side is min_side., type=int, default=800) parser.add_argument(--image-max-side, help=Rescale the image if the largest side is larger than max_side., type=int, default=1333)

第三部分：模型訓練

模型訓練可以使用以下命令：

python keras_retinanet/bin/train.py csv keras_retinanet/CSV/train_annotations.csv keras_retinanet/CSV/classes.csv --val-annotations keras_retinanet/CSV/val_annotations.csv

其中第一個參數csv代表要檢查的數據是自己製作的數據集，第二個參數是train_annotations.csv對應的路徑，第三個參數是classes.csv對應的路徑，第四個參數--val-annotations是val_annotations.csv對應的路徑。

多卡訓練可用如下命令：

python keras_retinanet/bin/train.py --multi-gpu-force --multi-gpu 2 --batch-size 2 csv keras_retinanet/CSV/train_annotations.csv keras_retinanet/CSV/classes.csv --val-annotations keras_retinanet/CSV/val_annotations.csv

第四部分：模型測試

#!/usr/bin/env python # coding=UTF-8

@Description:
@Author: HuangQinJian
@LastEditors: HuangQinJian
@Date: 2019-03-07 08:59:34
@LastEditTime: 2019-03-07 11:13:20

import os
import time

import keras
# import miscellaneous modules
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
# set tf backend to allow memory to grow, instead of claiming everything
import tensorflow as tf
from skimage.io import imsave

import cv2
from keras_retinanet import models
from keras_retinanet.utils.colors import label_color
from keras_retinanet.utils.image import (preprocess_image, read_image_bgr,
resize_image)
from keras_retinanet.utils.visualization import draw_box, draw_caption

if not os.path.exists(result):
os.mkdir(result)

def get_session():
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
return tf.Session(config=config)

os.environ["CUDA_VISIBLE_DEVICES"] = "1"

def predict_save(model, test_img_fold, test_img_list):
# load image
img_name_list = []
bboxes_list = []
class_list = []
score_list = []
for i in range(len(test_img_list)):
# for i in range(1):
img_name = test_img_list[i]
img_path = os.path.join(test_img_fold, img_name)
image = read_image_bgr(img_path)
# copy to draw on
draw = image.copy()
draw = cv2.cvtColor(draw, cv2.COLOR_BGR2RGB)
# preprocess image for network
image = preprocess_image(image)
image, scale = resize_image(image)
# process image
start = time.time()
# print(image.shape)
# print(scale)
boxes, scores, labels = model.predict_on_batch(
np.expand_dims(image, axis=0))
print("processing time: ", time.time() - start)
# correct for image scale
boxes /= scale
i = 0
for box, score, label in zip(boxes[0], scores[0], labels[0]):
# scores are sorted so we can break
if score < 0.5:
break
color = label_color(label)
b = box.astype(int)
img_name_list.append(img_name)
bboxes_list.append(b)
class_list.append(labels[0][i])
score_list.append(score)
i += 1
draw_box(draw, b, color=color)
caption = "{} {:.3f}".format(labels_to_names[label], score)
draw_caption(draw, b, caption)
imsave(result/+img_name, draw)
submit = pd.DataFrame()
submit[img_name] = img_name_list
submit[bbox] = bboxes_list
submit[class] = class_list
submit[score] = score_list
# submit.to_csv(submit.csv, index=None)
submit.to_pickle(submit.pkl)

if __name__ == "__main__":
# set the modified tf session as backend in keras
keras.backend.tensorflow_backend.set_session(get_session())

# adjust this to point to your downloaded/trained model
# models can be downloaded here: https://github.com/fizyr/keras-retinanet/releases

model_path = os.path.join(snapshots, old.h5)

# load retinanet model
model = models.load_model(model_path, backbone_name=resnet50)

# if the model is not converted to an inference model, use the line below
# see: https://github.com/fizyr/keras-retinanet#converting-a-training-model-to-inference-model
model = models.convert_model(model)

# print(model.summary())

# load label to names mapping for visualization purposes
labels_to_names = {0: tieke, 1: heiding,
2: daoju, 3: dian, 4: jiandao}

test_img_fold = keras_retinanet/CSV/data/jinnan2_round1_test_a_20190306/
test_img_list = os.listdir(test_img_fold)
print(len(test_img_list))
predict_save(model, test_img_fold, test_img_list)

可能會遇到的錯誤：

（1）ImportError: No module named keras_resnet

解決辦法：pip install keras-resnet --user

（2）在第四部分模型預測的時候，必須運行：

# if the model is not converted to an inference model, use the line below # see: https://github.com/fizyr/keras-retinanet#converting-a-training-model-to-inference-model model = models.convert_model(model)

否則會報如下錯誤：

boxes, scores, labels not enough values to unpack (expected 3, got 2)

參考資料： 1、Retinanet訓練自己的數據（2）：模型準備

Keras-RetinaNet訓練自己的數據詳細教程

熱門新聞

週熱門

Keras-RetinaNet訓練自己的數據詳細教程

PN-28: Sub-policy Adaptation for HRL (arXiv 1906)

重磅！圖像分類相關文獻/代碼大列表

輕量型網路：MixNet解讀

強化學習之Q-Learning

【學習筆記】cs231n中assignment1中的k-Nearest Neighbor (kNN) exercise

【學習筆記】cs231n中assignment2的dropout

詳解PyTorch中的ModuleList和Sequential

人工智慧ai演算法、深度學習、機器學習、自然語言處理工程師崗位

F-Principle：初探理解深度學習不能做什麼

換臉視頻後AI又出偏門應用：用演算法「脫」女性衣服

【KDD18最佳論文揭曉】中科大等斬獲最佳學生論文

用小樣本數據集構建強大的圖像分類模型

「知識星球」網路結構1000變上線，下半年更新500+網路模型解讀

物體檢測模型backbone的權重，使用預訓練，或沒有預訓練，哪個更佳？

如何檢測圖片中物體的方向?

熱門新聞

週熱門