台湾 || 语言: 大陆简体港澳繁體台灣正體

【數字圖像處理系列四】圖像數據集增強方式總結和實現

雪花臺灣 2019-04-25 01:36

內容遷移來自博主博客：

https://blog.csdn.net/feilong_csdn?

blog.csdn.net

本系列python版本：python2.7.15

本系列opencv-python版本：opencv-python3.4.2.17

本系列使用的開發環境是jupyter notebook，是一個python的互動式開發環境，測試十分方便，並集成了vim操作，安裝教程可參考：windows上jupyter notebook主題背景、字體及擴展插件配置(集成vim環境)

前幾篇分享多以數字圖像基礎知識為中心，本文分享一下在圖像處理的項目中經常需要用到的，重要的圖像預處理：圖像數據集增強。在實際項目中，我們經常會遇到數據集太小，數據量不夠等問題，這直接導致了接下來的工作無法進行，本文便來嘮一嘮如何在擁有一部分圖像數據的情況下擴充數據集的方式

一、數據集項目背景

本文數據集使用介紹：數據集是基於英文手寫體識別開發，因此本文圖片數據集是含手寫體英文的圖片，標籤數據是圖片對應的正確的文本txt文件，因此對數據集的拓展包括兩方面，一是英文手寫體圖片的拓展，一是英文手寫體圖片對應的文本txt文件的拓展，產生新數據集用於神經網路訓練。展示個別圖片數據如下：

相關文章