使用Python+OpenCV+GAN实现车牌图像增强-技术圈

点击上方“AI小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转载自：深度学习与计算机视觉

在好莱坞的犯罪电影中，我们经常看到侦探们在电脑高手的帮助下进行破案，他们可以从模糊、低质量的图像中发现隐藏的信息。在技术上，电影中的黑魔法被称为（SISR）

在各种SISR应用中，汽车牌照的超分辨率以其巨大的潜力绝对是名列前茅的。例如，它可以用于执法，还可用于提高车牌识别和街道识别（地图服务）的准确性。

在本文中，将介绍在Python中实现的车牌图像增强。Jupyter notebook教程可以在此处（https://github.com/zzxvictor/License-super-resolution）找到。

展示

在深入探讨模型体系结构和训练策略细节之前，向你展示一下模型的能力：

我们在逃逸事故案例中发现一个问题：车牌是在黑暗条件下由低质量摄像头拍摄的，而我们的模型不仅可以提高分辨率，还可以通过对图像进行去噪、调整亮度和对比度来增强车牌号的易读性。

系统架构

预处理

我们在本项目中使用的数据集为中国城市停车场数据集（https://github.com/detectRecog/CCPD），它包含了200k+个不同条件下的汽车图像，然而原始数据不能被直接使用，但是我们只需要车牌图像而不是街景和汽车，因此第一步是使用数据集提供的注释从图像中裁剪出车牌图像。

我们还过滤掉亮度和对比度差的图像，只保留好的部分作为标签。我们人工生成车牌图像数据（input，label），其中输入经过降采样和噪声、同时随机进行亮度和对比度的破坏，而标签不变。

模型详细信息

我们的模型受ESRGAN模型（https://arxiv.org/abs/1809.00219）的启发。顾名思义，我们的模型是在对抗性的方式下进行训练的——生成器和鉴别器相互对抗。

生成器

我们的生成器是建立在两个最先进的模型之上的——在ESRGAN的RRDB网络和残差密集网络。生成器使用亚像素卷积（在tensorflow中称为tf.depth_to_space，在Pythorch中称为Pixel Shuffle）在低分辨率图像上进行8倍采样。基本上，亚像素卷积的作用是将一个大小为10 x 10 x 64的特征映射压缩到另一个深度较浅的较大特征映射（如果上采样率为8，则为80 x 80 x 1）。