一、文本檢測

1.傳統方法

(1)SWT

(2)MSER

(3)ER

(4)Selective Search

(5)EdgeBox

2.深度學習方法

(1)R-CNN

首先提取一系列的候選區域,然後對這些候選區域用CNN提取固定長度的特徵,然後用SVM對特徵進行分類,最後對候選區域進行微調。

(2)Fast R-CNN

將SPP的空間金字塔池化思想引入到R-CNN,用softmax代替SVM分類器,同時將bounding box 回歸納入到整體框架中。

(3)Faster R-CNN

用RPN(區域生成網路)取代以往演算法的區域生成階段,然後交替訓練,使得RPN和Fast RCNN共享參數。

(4)CTPN(2016)

eragonruan/text-detection-ctpn?

github.com
圖標

(5)SegLink(2017)

dengdan/seglink?

github.com
圖標

(6)EAST(2017)

缺點:

檢測長文本效果不夠好,因為感受野不夠大,而且分數採用sigmod函數【0-1】,以512為基準,這樣樣本都落在很小的地方,就很不均衡。

參考:

文字檢測與識別項目整理 - 我若成風者 - 博客園?

www.cnblogs.com
圖標

代碼鏈接:

argman/EAST?

github.com圖標

(7)SPCNet曠視科技:一種任意形狀的場景文本檢測演算法

(8)【ICCV2017】Deep TextSpotter_An End-to-End Trainable Scene Text Localization and Recognition Framework

論文:

https://drive.google.com/file/d/0B8SUcdkLTcuTSmo4T2ozMWtDaUU/view?

drive.google.com

代碼:

MichalBusta/DeepTextSpotter?

github.com
圖標

(9)端到端的深度學習文本檢測框架 Pixel-Anchor

Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks?

arxiv.org

參考鏈接:

雲從科技 OCR 新突破:端到端的深度學習文本檢測框架 Pixel-Anchor?

www.leiphone.com
圖標

(10)ECCV 2018 | 曠視科技提出新型端到端可訓練網路Mask TextSpotter:可檢測和識別任意形狀的文本

https://github.com/lvpengyuan/masktextspotter.caffe2?

github.com


推薦閱讀:
相关文章