图像中的文字识别算法研究论文?
共 612字,需浏览 2分钟
·
2022-02-09 17:41
以前做过一点类似的工作,不知道对你是否有帮助,你姑且参考一下:
1.OCR其实是很古老的一个技术了,我理解的OCR是印刷文本中的文字识别,或者手写体等,目前感觉已经没啥做的,
2.现在学术界研究得比较多的是自然场景中的文字识别,如街道上的广告牌,商场中的店铺名,在电商场景里面,如淘宝,拼多多等需要对图片中的文字识别,用于内容风控等。
3.目前图像类的算法基本都是要利用卷积神经网络来做的,所有你只能选深度学习来做了;
4.文字识别,与文字检测是在发论文的时候,是会区分的,你要确定你是只做检测还是做识别,还是两者都要做;
所以,我理解的你要做的是我说的第2种,在这个方向里面有可以具体细分,如竖版文字识别,不规则形状文字识别等
可以推荐的资料:
- 可以关注华科的白翔老师的工作:
有论文也有code, 本科生可以先跑起来,再看看原理
2.阿里天池平台以前有过一个电商图片的文字检测,文字识别的比赛,github上应该有很多代码可以参考,
ICPR MTWI 2018 挑战赛二:网络图像的文本检测-天池大赛-阿里云天池先简单写这么多吧,这都是我2年前的记忆,没有关注最新的内容,希望对你有帮助(不要脸的让你点赞,收藏)
20200514新增:
https://github.com/PaddlePaddle/PaddleOCR评论