如何使用OpenCV+Python去除手机拍摄文本底色-技术圈

点击上方“AI算法与图像处理”，选择加"星标"或“置顶”

重磅干货，第一时间送达

来源：OpenCV学堂
关注获取更多计算机视觉与深度学习知识

起因

最近经常被要求手机拍摄考试卷，但是拍摄完之后，跟实际的黑白考试卷有很大的色差，打印出来之后背景就变成了灰色，看着很不舒服。于是我想起了好久以前，我用过的一个软件叫全能扫描王，发现它里面是有去除这种文本底色的功能的，但是有时候也很坑！我就想手动写一个简单python程序来实现。最终我写出的程序测试效果如下：

左侧是用手机拍摄的图像，右侧是用opencv-python处理之后的结果。

思路分析

首先看一下输入的原图，（小学生作业找不到了，让我给他打印是起因，他要手写，我说我来处理一下打印出来），别人拍的原图：

我发现这些图像基本上都是黑白纸张或者有些有虚线的纸张，我首先想到把文字部分从输入图像中都抠出来来，不需要太精准，大致就可以了，所以要获取图像中文字的mask，我就想到了用二值化的方法，我首先尝试了全局二值化OTSU与三角法来获取mask，发现效果都有点坑爹！图示如下：

最终效果是这样，而当光线稍微有点不均匀的时候，这个就直接在二值话时候翻车了！会丢失信息，所以我想到了用自适应的二值化方法，最终选择：

binary = cv.adaptiveThreshold(image, 255, cv.ADAPTIVE_THRESH_GAUSSIAN_C, cv.THRESH_BINARY_INV, 25, 15)

该函数来完成二值化，实现mask提取

提取完成之后，通过了一个形态学操作来实现简单的膨胀操作，这样确保每个字像素范围足够大，不会丢失。最终自适应的mask：

然后与原图实现与操作，得到真实文字区域，使用mask区域取反得到mask1，然后对mask与输入的灰度图像完成bitwise_and操作，得到的结果与mask1相加即可得到最终的效果，图示如下：

不会像二值话之后的那样让人眼睛看到不舒服的黑色，想要获取该例子完整源代码，请关注 公众号，然后回复 “ 文本去背景 ”

下载1：leetcode 开源书

在「AI算法与图像处理」公众号后台回复：leetcode，即可下载。每题都 runtime beats 100% 的开源好书，你值得拥有！

下载2 CVPR2020

在「AI算法与图像处理」公众号后台回复：CVPR2020，即可下载1467篇CVPR 2020论文

个人微信（如果没有备注不拉群！）

请注明：地区+学校/企业+研究方向+昵称

觉得不错就点亮在看吧

‍