使用OpenCV实现图像覆盖-技术圈

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

每张图像都包括RGB三个通道，分别代表红色、绿色和蓝色，使用它们来定义图像中任意一点的像素值，红绿蓝的值在0-255之间。

例如：一个像素值[255,0,0]代表全部为红色，像素值[255,255，0]是红色和绿色的混合，将显示为黄色。

但是，如果使用OpenCV读取图像，它将以BGR格式生成图像，那么[255,0,0]将代表蓝色。

使用OpenCV读取一张图像

任何图像都可以通过OpenCV使用cv2.imread()命令读取。不过，OpenCV不支持HEIC格式的图像，所以不得不使用其它类型的库，如Pillow来读取HEIC类型的图像（或者先将它们转换为JPEG格式）

import cv2image = cv2.imread(‘image.jpg’)

当读取图像之后，如果有必要的话可以将其从BGR格式转换为RGB格式，通过使用cv2.cvtColor()命令实现。

image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)image_gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

覆盖

图像可以看作是是一堆像素值以类似矩阵的格式存储。任何像素的值都可以独立于其他像素进行更改。这里有一张图像，使用OpenCV读取图像：

image_1

image_1 = cv2.imread(‘image_1.jpg’)print(image_1)

这里将给出矩阵形式的一系列像素值

array([[[107, 108, 106],[107, 108, 106],[107, 108, 106],…,[ 77, 78, 76],[ 77, 78, 76],[ 76, 77, 75]],…,[[ 93, 88, 87],[ 93, 88, 87],[ 92, 87, 86],…,[ 52, 62, 62],[ 52, 62, 62],[ 52, 62, 62]]], dtype=uint8)

如果只改变图像某一区域的像素值，比如更改为[0,0,0]，这部分区域将变成黑色，因为这是颜色为黑色的像素值。同样，如果将像素值更改为[255,0,0]，则该区域将变为蓝色(OpenCV以BGR格式读取图像)。

image_1[50: 100, 50:100] = [255, 0, 0]

同样，这些像素值可以被另一幅图像替换，只需通过使用该图像的像素值。

为了做到这一点，我们需要将覆盖图像修改为要替换的像素值的大小。可以通过使用cv2.resize()函数来实现

image_2 = cv2.imread(‘image_2.jpg’)resized_image_2 = cv2.resize(image_2, dsize=(100, 100))

其中，dsize 代表图像要被修改的尺寸。

现在，可以将第二张图像够覆盖在第一张图片的上面

image_1[50:150, 50:150] = resized_image_2

覆盖PNG图像

与JPEG图像不同，PNG图像有第四个通道，它定义了给定像素的ALPHA(不透明度）。

除非另有规定，否则OpenCV以与JPEG图像相同的方式读取PNG图像。

为了读取带有Alpha值的PNG图像，我们需要在读取一张图像时指定标志cv2.IMREAD_UNCHANGED。现在，这个图像已经有了四个通道：BGRA

image_3 = cv2.imread(‘image_3.png’, cv2.IMREAD_UNCHANGED)print(image_3)array([[[0 0 0 0][0 0 0 0][0 0 0 0]…[0 0 0 0][0 0 0 0][0 0 0 0]]…[[0 0 0 0][0 0 0 0][0 0 0 0]…[0 0 0 0][0 0 0 0][0 0 0 0]]], dtype=uint8)

然而，这个图像有4个通道，但是我们的JPEG图像只有3个通道，所以这些值不能简单地替换。

我们需要在我们的JPEG图像中添加一个虚拟通道。

为此，我们将使用 numpy。可以使用pip install numpy命令安装它。

numpy提供了一个函数numpy.dstack() 来根据深度叠加值。

首先，我们需要一个与图像大小相同的虚拟数组。

为了创建虚拟通道，我们可以使用numpy.ones()函数创建一个数组。

import numpy as npones = np.ones((image_1.shape[0], image_1.shape[1]))*255image_1 = np.dstack([image_1, ones])

我们将其数组与255相乘，因为alpha通道的值也存在于0-255之间。

现在，我们可以用PNG图像替换图像的像素值。

image_1[150:250, 150:250] = image_3

然而，它不会给出期望的结果，因为我们将alpha通道的值改为了零。

我们只需要替换那些具有非零值的像素值。为了做到这一点，我们可以通过检查每个像素值和替换非零值来强行执行，但这很耗时。

这里有一个更好的方法。我们可以获取要覆盖图像的alpha值。

alpha_image_3 = image_3[:, :, 3] / 255.0

我们将像素值除以255.0，以保持值在0-1之间。

image_1 和image_3的alpha之和需要等于255。因此，我们可以创建另一个数组，其中包含和等于255的所需alpha值。

alpha_image = 1 — alpha_image_3

现在，我们可以简单的取每个图像的alpha值和每个通道的图像像素值的元素乘积，并取它们的和。

for c in range(0, 3): image_1[150:250, 150:250, c] = ((alpha_image*image_1[150:250,      150:250, c]) + (alpha_image_3*image_3[:, :, c]))

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~