文本檢測及識別整理
一、文本檢測
1.傳統方法
(1)SWT
(2)MSER
(3)ER
(4)Selective Search
(5)EdgeBox
2.深度學習方法
(1)R-CNN
首先提取一系列的候選區域,然後對這些候選區域用CNN提取固定長度的特徵,然後用SVM對特徵進行分類,最後對候選區域進行微調。
(2)Fast R-CNN
將SPP的空間金字塔池化思想引入到R-CNN,用softmax代替SVM分類器,同時將bounding box 回歸納入到整體框架中。
(3)Faster R-CNN
用RPN(區域生成網路)取代以往演算法的區域生成階段,然後交替訓練,使得RPN和Fast RCNN共享參數。
(4)CTPN(2016)
eragonruan/text-detection-ctpn(5)SegLink(2017)
dengdan/seglink(6)EAST(2017)
缺點:
檢測長文本效果不夠好,因為感受野不夠大,而且分數採用sigmod函數【0-1】,以512為基準,這樣樣本都落在很小的地方,就很不均衡。
參考:
文字檢測與識別項目整理 - 我若成風者 - 博客園代碼鏈接:
argman/EAST
(7)SPCNet曠視科技:一種任意形狀的場景文本檢測演算法
(8)【ICCV2017】Deep TextSpotter_An End-to-End Trainable Scene Text Localization and Recognition Framework
論文:
https://drive.google.com/file/d/0B8SUcdkLTcuTSmo4T2ozMWtDaUU/view代碼:
MichalBusta/DeepTextSpotter(9)端到端的深度學習文本檢測框架 Pixel-Anchor
Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks參考鏈接:
雲從科技 OCR 新突破:端到端的深度學習文本檢測框架 Pixel-Anchor(10)ECCV 2018 | 曠視科技提出新型端到端可訓練網路Mask TextSpotter:可檢測和識別任意形狀的文本
https://github.com/lvpengyuan/masktextspotter.caffe2推薦閱讀: