机器视觉算法之光学字符识别(OCR)
技术来自于点击下方卡片,关注“新机器视觉”公众号
视觉/图像重磅干货,第一时间送达
光学字符识别(OCR)
在非常多的应用中都需要将检测对象上印刷的字符识别出来。例如,产品的可追溯性经常需要在每个产品上贴上一个序列号,因此我们必须读取这个序列号。在其他某些应用中,可能必须通过读取序列号来控制生产流程。
光学字符识别(OCR)是在图像中 识别字符的过程。它包含两个任务:将图像中单个字符分割出来以及将分割得到的字符进行分类,也就是说为分割得到的区域分配一个符号标记。
字符分割
将字符进行分类需要我们首先将文本分割成为单个的字符,也就是说每个字符必须对应于一个区域。
为了分割字符,我们可以使用这个方法:使用固定 的阈值或自动选择的阈值进行阈值分割、动态阈值分割以及提取图像中连通区域。
使用形态学方法将同一个字符分离的部分连接起来,例如将字符“i” 的小圆点与下面的部分连接起来。
最简单的策略是为图像中每个预期的字符定义一个单独的感兴趣区域 (ROI)。工业应用中有时可以使用这种策略,这是由于字体间距(宽度)固定,并且我们事先已经知道图像中多少个字符,例如在我们试图在图像中读取一个固定长度的序列号时就可以使用这种策略。就是字符的感兴趣区域(ROI)必须将需要分离的单个字符包含在内。
特征提取
字符分类
评论