五行Python代码轻松实现OCR文字识别

统计与数据分析实战

共 939字,需浏览 2分钟

 ·

2020-11-28 15:53


◆ ◆ ◆  ◆ 



背景


今天周六,闲来无事打开百度搜索了一下——渣男语录


万万没想到,百度文库竟然不让我复制这些语句。


这我不能忍!!!!我可是会Python的男孩纸~



我可是严小样儿啊!于是,我成功复制了渣男语录!


今天,我就用五行Python代码轻松教你实现OCR,秒变渣男~ 嘿嘿嘿


五行代码


首先,说个大前提,我这种方法是用来识别图片上的文字的。也就是说,你想把图片上的文字扒下来,用我的方法肯定没错!

# 第一步:导包from aip import Aipocr as ocr# 第二步:读取with open(path,'rb') as f:    img = f.read()# 第三步:调用cli = ocr(appId, apiKey, secretKey)# 第四步:识别rlt = cli.general(img)# 第五步:输出for line in rlt['words_result']:    print(line.get('words'))






此时,可能会有些杠精会说:你这是楷书,识别起来肯定很容易啊!有本事识别手写体,还有连笔的行书啊。


安排~




还有那些年抄过的歌词~




最后,再来几句诗~



虽说可能些许有点瑕疵,但是如果是正式文件或者是楷体字,对于那些想要把图片上的文字扒下来的需求已经足够了。我不会告诉你,我曾经有一份工作真的需要把图片的文字转换成word文档,那时候废了老劲了~



打包为exe


为了方便其他人员使用,我们可以用pyinstaller库进行封装生成exe可执行文件。



怎么样?学会了吗!如果对本文章感兴趣,可以在公众号后台发送“微信”,即可添加作者微信,咨询代码、答疑解惑,还可加群。



<以下内容,点击跳转>


Pandas遇上Pyecharts碰撞出可交互的可视化效果

可视化图解Python科学计算包NumPy

Python之pandas实现更复杂的Excel操作

Python实现行转列?!超简单,赶快get起来


在看”的永远18岁~
浏览 45
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报