一种去水印的营业执照识别方法
向AI转型的程序员都关注了这个号👇👇👇
机器学习AI算法工程 公众号:datayx
营业执照识别,主要包括图片去水印,图片中文字检测,图片文字块的识别。
pix2pixHD图像去水印
a.制作需要的水印图片,获取相应的水印信息,如倾斜,大小比率,颜色,图片中水印与水印的距离等。收集相应的没有水印的营业执照图片;
b.搭建pix2pixHD模型,修改相应训练参数;
c.对于输入的图像,添加水印合成模块,设置透明度,倾斜等信息,将制作好的水印覆盖到图片相应的位置;
d.执行网络,得到输出图片,计算损失函数值,更新网络;
e.重复c,d步骤,直至网络收敛,训练完成;
图片文字块检测
A.采用vgg-16网络提取特征;
B. 类别的标定:双向LSTM层判断是否为文字块rpn_score,并获取与真实文字块距离的信息rpn_bbox;
C.通过rpn_score及rpn_bbox信息获取图片中文字块的信息;
图片文字块识别
A.训练样本的生成,收集营业执照图片,利用CTPN算法检测到文字块区域,利用边缘检 测算法检测到图片边缘及非平滑区域。将这两种区域的像素点用周围范围内的非该区域的点的平均值替换掉,左右写入文字的背景图片;;
B.特征提取,5Conv+3MaxPooling+3Bn,利用卷积获取局部信息,在更高层将局部的信息综合起来就得到了全局的信息;利用pooling进行降维操作;
C.序列的标定:双向LSTM层获得属于每个类别的概率;
D.翻译层:去除重复的识别结果及非字符;
图像去水印效果图:
营业执照检测识别效果
机器学习算法AI大数据技术
搜索公众号添加: datanlp
长按图片,识别二维码
阅读过本文的人还看了以下文章:
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx