图像中的文字识别算法研究论文?

知乎用户

共 612字,需浏览 2分钟

 ·

2022-02-09 17:41

以前做过一点类似的工作,不知道对你是否有帮助,你姑且参考一下:

1.OCR其实是很古老的一个技术了,我理解的OCR是印刷文本中的文字识别,或者手写体等,目前感觉已经没啥做的,

2.现在学术界研究得比较多的是自然场景中的文字识别,如街道上的广告牌,商场中的店铺名,在电商场景里面,如淘宝,拼多多等需要对图片中的文字识别,用于内容风控等。

3.目前图像类的算法基本都是要利用卷积神经网络来做的,所有你只能选深度学习来做了;

4.文字识别,与文字检测是在发论文的时候,是会区分的,你要确定你是只做检测还是做识别,还是两者都要做;

所以,我理解的你要做的是我说的第2种,在这个方向里面有可以具体细分,如竖版文字识别,不规则形状文字识别等

可以推荐的资料:

  1. 可以关注华科的白翔老师的工作:
Homepage of Xiang Bai

有论文也有code, 本科生可以先跑起来,再看看原理

2.阿里天池平台以前有过一个电商图片的文字检测,文字识别的比赛,github上应该有很多代码可以参考,

ICPR MTWI 2018 挑战赛二:网络图像的文本检测-天池大赛-阿里云天池


ICPR MTWI 2018 挑战赛一:网络图像的文本识别-天池大赛-阿里云天池


先简单写这么多吧,这都是我2年前的记忆,没有关注最新的内容,希望对你有帮助(不要脸的让你点赞,收藏)

20200514新增:

github.com/PaddlePaddle

浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报