调整图像大小的三种插值算法总结

共 2351字,需浏览 5分钟

 ·

2022-03-22 09:37

点击下方卡片,关注“新机器视觉”公众号

重磅干货,第一时间送达

插值是一种在已知数据点的离散集合范围内构造新数据点的方法。我们对自变量的中间值插值(或估计)该函数的值。

有各种各样的插值。让我们关注其中的三个

近邻插值

这种类型的插值是最基本的。我们简单地将最近的像素插值到当前像素。假设,我们从0开始索引像素的值。下面2x2图像的像素如下:{' 10 ':(0,0),' 20 ':(1,0),' 30 ':(0,1),' 40 ':(1,1)}

e6b74b849884798ef945aebcf48cec7a.webp

然后我们将此图像投射到4x4图像上,我们需要找到像素。我们发现未知像素位于(-0.5,-0.5),(-0.5,0.5)等等…

现在比较已知像素的值和最近的未知像素的值。之后,将最接近的值P(-0.5,-0.5)赋值为10,即像素在(0,0)处的值。

结果如下-

3b1c8cd5bc0790c6386afb0dc1337c16.webp

正如我们所看到的,我们得到一个4x4图像,每个像素看起来比原始图像更大。由于这种方法只是简单地寻找最近的邻居,并一次计算一个像素,它需要最少的处理时间。

为了在openCV中使用这种类型的插值来调整图像的大小,我们在cv2中使用了cv2.INTER_NEAREST插值标志

 import numpy as np
 import cv2
 from matplotlib import pyplot as plt
 
 img = cv2.imread("cube.png", -1);
 h, w, c = img.shape;
 
 img_n = cv2.resize(img, (w//2, h//2), interpolation = cv2.INTER_NEAREST);
 img_n = cv2.resize(img_n, (w, h), interpolation = cv2.INTER_NEAREST);

此代码片段输出如下结果-

7633bd62d6c33050790596c2bdba170b.webp

这种形式的插值只会让每个像素更大,当我们想要调整图像的大小时,这通常是有用的,而这些图像没有像条形码那样复杂的细节。

双线性插值

在双线性插值中,我们取未知像素的4个最近的已知邻域(2x2邻域)的值,然后取这些值的平均值来分配未知像素。

让我们首先了解如何在一个简单的示例中工作。假设我们随机取一个点(0。75,0。25)在四个点-的中间

(0,0)、(0,1),(1,0)、(1,1)。

我们首先用线性插值法求点A(0.75, 0)和点B(0.75, 1)的值。线性插值基本上是对两点之间的一个点进行近似根据两点之间的距离来缩放这个点。

然后我们在点A和点B上使用线性插值得到所需的像素值(0.75,0.25)。

既然我们已经理解了这些值是如何得到的,那么让我们把它放到一个2x2图像的环境中,这个图像已经进行了最近的近邻插值。

考虑将2x2图像投影到4x4图像上,但只有角落像素保留这些值。剩下的像素在技术上处于四个像素的中间,然后通过使用一个比例来根据更接近的像素分配权重来计算。

例如,考虑像素(0,0)为10,像素(0,3)为20。像素(0,1)将通过取(0.75 * 10)+(0.25 * 20)得到12.5来计算。同样,在调整大小的同时对图像进行线性插值,效果如下:

86459a6def47596d045bd75214ea9df4.webp

双线性插值比近邻插值具有更长的处理时间,因为它需要4个像素值来计算被插值的像素。然而,它提供了一个更平滑的输出。

为了在openCV中使用这种类型的插值来调整图像的大小,我们在cv2中使用了cv2.INTER_LINEAR插值。导入上面最近邻插值方法下给出的相同库,使用cv2读取图像,然后使用cv2.INTER_LINEAR插值。

 img_b = cv2.resize(img, (w//2, h//2), interpolation = cv2.INTER_LINEAR);
 
 img_b = cv2.resize(img_b, (w, h), interpolation = cv2.INTER_LINEAR);

87e637fcef86bc659adcfbdefd5be7f1.webp

双立方插值

在双立方插值中,我们将待插值的像素周围的16个像素(4x4邻域)与双线性插值中考虑的4个像素(2x2邻域)相比。

考虑4x4曲面,我们可以用这个公式找到插值像素的值:

87e637fcef86bc659adcfbdefd5be7f1.webp

插值问题包括确定16个系数aᵢⱼ。这些系数可以由像素矩阵和单个像素的偏导数得到的p(x, y)值确定。

在计算系数后,我们将它们与已知像素的权重相乘,然后插值未知像素。让我们使用和上面两个例子一样的输入2x2图像。通过双立方插值,得到如下结果:

5599bafe4726159697b9a2fed3fdb59f.webp

现在,为了用cv2执行这个插值,我们将再次调用resize函数,但这次是用cv2.INTER_CUBIC。同样,在导入所有必要的库并使用cv2.imread()读取图像之后运行代码

 img_c = cv2.resize(img, (w//2, h//2), interpolation = cv2.INTER_CUBIC);
 
 img_c = cv2.resize(img_b, (w, h), interpolation = cv2.INTER_CUBIC);

与前两种方法相比,这产生了明显更清晰的图像,并平衡了处理时间和输出质量。在许多编辑程序、打印机驱动程序和相机中都是用这种插值算法作为标准。

因此,我们可以看到不同的插值技术有不同的用例。因此,了解在调整图像大小时最有用的插值类型非常重要。

作者:Annmay Sharma


原文地址:https://annmay10.medium.com/resizing-images-using-various-interpolation-techniques-4b99800999f2

deephub翻译组

来源:DeepHub IMBA


本文仅做学术分享,如有侵权,请联系删文。

—THE END—
浏览 99
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报