Ying Zhang

0获赞0关注0粉丝

喜欢

OCR文字识别用的是什么算法？

根据近期的一些paper总结一下，说的不对请多指正。 General OCR一般包含两步: 1. detection-->找到包含文字的区域(proposal); 2. classification-->识别区域中的文字。先说detection models, 近两年比较热门的object detection model有 faster-rcnn(https://arxiv.org/pdf/1506.01497.pdf ) 和 yolo(http://pjreddie.com/media/files/papers/yolo.pdf ), 两个模型都是基于CNN给出proposed regions 同时对object region进行分类。其中yolo比faster-rcnn的速度更快，但是在accu…