[OpenCV]经典霍夫变换原理-技术圈

本文主要讲述的是霍夫变换的一些内容，并加入一些在生活中的应用，希望能对读者对于霍夫变换的内容有所了解。

首先我先说的是，霍夫变换是一个特征提取技术。其可用于隔离图像中特定形状的特征的技术，应用在图像分析、计算机视觉和数字图像处理领域。目的是通过投票程序在特定类型的形状内找到对象的不完美实例。这个投票程序是在一个参数空间中进行的，在这个参数空间中，候选对象被当作所谓的累加器空间中的局部最大值来获得，所述累加器空间由用于计算霍夫变换的算法明确地构建。此处我们主要介绍的是比较基本的霍夫变换在直线中的应用，例如在图像中检测直线（线段），Hough变换的主要优点是对于噪声有良好的鲁棒性。

基础原理介绍

正如我们上面所介绍的那样，霍夫变换最简单的是检测直线。我们知道，直线的方程表示可以由斜率k和截距b表示（这种表示方法，称为斜截式，也就是高中的时候学习到的一种常用形式），如下所示：

y=kx+b

如果我们用参数空间表示则为(b,k),即,我们可以用斜率和截距就能表示一条直线。但这种形式会产生一个问题，那就是当我们的直线斜率k为无限大的时候（即垂线），这会使得该直线无法使用斜截式来进行表示，此处我们需要使用到另一种直线的表现形式：黑塞法线式（或者简称为法线式）：

r=xcosθ+ysinθ

其中r是原点到直线上最近点的距离(其他人可能把这记录为ρ，下面也可以把r看成参数ρ，两者含义相同)，θ是x轴与连接原点和最近点直线之间的夹角。如下图图1所示。

从而我们可以将图像的每一条直线与一对参数(r,θ)相关联。由参数(r,θ)构成的平面有时被称为霍夫空间，用于表示二维直线所构成的集合。

我们经过Hough变换后，我们圆来笛卡尔坐标系中的一个点可以映射到Hough空间中去，如下图图2所示。

（注：图2表示的是原坐标系中，过该点的所有可能直线的集合在Hough空间中的表示。）

图2显示了经过原笛卡尔坐标系中的定点（3,4），通过该点的所有可能直线的(r,θ)的关系。显示了在极坐标对极径极角平面绘出所有通过该定点的直线, 将得到一条正弦曲线。正弦曲线的形状取决于，点到所定义原点的距离r。通常，r越大，正弦曲线的振幅越大，反之则会越小。

所以我们可以得到一个结论，给定平面中的单个点，那么通过该点的所有直线的集合对应于(r,θ)平面中的正弦曲线，这对于该点是独特的。一组两个或更多点形成一条直线将产生在该线的(r,θ)处交叉的正弦曲线。因此，检测共线点的问题可以转化为找曲线相交点的问题。

例：

考虑下面三个点，这里显示为黑点。（下图为图3）

（注：此处也展示了霍夫变换的几个基本步骤：首先，对每个点均绘制不同角度的线条，这些线全部经过各自的对应点并显示为实线。其次，对于每条实线，找到经过原点的对应垂线并显示为虚线。然后找到虚线的长度和角度。这些值显示在图表下方的表格中。这对被转换的三个点中的每一个都重复该过程。然后将结果绘制成图，有时称为霍夫空间图，如下图图4所示）

图4中曲线相交的点给出的距离和角度表示各个测试点相交的线。在图4中，所示的线条在粉红点相交; 这对应于图3中的实线粉红线，其穿过三个点。

分析上下文，边缘段的点（一个或多个）的坐标(xi,yi)在图像中是已知的，并且因此作为参数线等式中的常量，而r与θ是未知变量是我们要寻找的。如果我们绘制由(r,θ)每个定义的可能值(xi,yi)，笛卡尔图像空间中的点映射到霍夫参数空间中的曲线（正弦曲线）。这个点到曲线的变换是直线的霍夫变换。当在霍夫参数空间中查看时，在笛卡尔图像空间中共线的点变得很明显，因为它们产生在相同(r,θ)点相交的曲线。

霍夫变换提取直线

我们通过将霍夫参数空间量化为有限间隔或累加器单元来实现变换。随着算法的运行，每个算法都把(xi,yi)转换为一个离散化的 (r,θ)曲线，并且沿着这条曲线的累加器单元被递增。累加器阵列中产生的峰值表示图像中存在相应的直线的相应证明。

此时需要注意的是，现在我们考虑的是直线的霍夫变换。累加器阵列的维度是二维的（也就是r和θ)。

那么对于图像来说，(x,y)处的每个像素及其邻域，霍夫变换算法被用于确定该像素是否有足够的直线证据。如果是，它将计算该线的参数 (r,θ)，然后查找参数落入的累加器箱，并增加该箱的值（投票值）。通过查找具有最高值的箱，通常通过查找累加器空间中的局部最大值，可以提取最可能的线，并且读出它们的（近似的）几何定义。

找到这些峰值的最简单方法是通过应用某种形式的阈值，但其他技术可能在不同情况下产生更好的结果。由于返回的行不包含任何长度信息，因此通常有必要在下一步中查找图像的哪些部分与哪些行匹配。此外，由于边缘检测步骤中存在缺陷误差，通常会在累加器空间中出现错误，这可能使得找到合适的峰值以及适当的线条变得非常重要。

线性霍夫变换的最终结果是类似于累加器的二维阵列（矩阵），该矩阵的一个维度是量化角度θ，另一个维度是量化距离r。矩阵的每个元素的值等于位于由量化参数 (r,θ)表示的线上的点或像素的总和。所以具有最高值的元素表示输入图像中代表最多的直线。我们也可以把累计器单元的结果认为是投票值。换句话说，将每个交点看成一次投票，也就是说A(r,θ)=A(r,θ)+1，所有点都如此进行计算后，可以设置一个阈值，投票大于这个阈值的可以认为是找到的直线。

霍夫变换提取圆

而当我们需要去进行圆检测的时候，我们累加器是三维累加器，在圆检测的情况下，我们可以知道的是其对应的参数方程为：

(x−a)2+(y−b)2=r2

其中a和b是圆心的坐标并且是r半径。在这种情况下，算法的计算复杂度开始增加，因为我们现在在参数空间和三维累加器中有三个坐标。（通常，累加器阵列的计算和大小随着参数数量的增加而多项式增加，因此，基本霍夫技术仅适用于简单曲线。）

它的算法步骤如下：
1.首先创建累加器空间，由每个像素单元格构成。最初每个单元格都设置为0。

2.然后对于每个图像中的边缘点(i,j)，按照圆方程(i−a)2+(j−b)2=r2将那些可能是一个圆中心的单元格值进行累加。这些单元格在等式中由字母a表示。

3.然后在前面的步骤中由每个可能找到的值a，区找到满足等式的所有可能值b。

4.搜索累加器空间中的局部最大值。这些单元格表示算法检测到的圆圈。

如果我们不知道事先定位的圆的半径，可以使用三维累加器空间来搜索具有任意半径的圆。当然，这在计算上更加昂贵。

该方法还可以检测部分位于累加器空间外部的圆，只要该圆的区域内仍有足够的圆。

总结

霍夫变换在很多地方都有着应用，如果是在OpenCV（Python）下想要使用霍夫变换，只需要使用函数cv2.HoughLinesP函数，需要注意的是该函数并不是标准的霍夫变换，其为：概率霍夫变换，它只分析点的子集并估计这些点都属于一条直线的概率，这是标准霍夫变换的优化版本。该函数计算代价少，执行更快，但准确度有一定程度的下降。

cv2.HoughLinesP函数的语法如下：

cv2.HoughLinesP(image,rho,theta,threshold,minLineLength,maxLineGap)

其参数分别解释如下：

·image：要处理的二值图像；·rho：线段的几何表示，表示取距离的间隔，一般取1；·theta：线段的几何表示，表示取角度的间隔，一般取np.pi/180；·threshold：阈值，低于该阈值的会被忽略；·minLineLength：最小直线长度，小于该长度会被忽略；·maxLineGap：最大线段间隙，大于此间隙才被认为是两条直线。

霍夫变换在自动驾驶中也有所应用，可以如下面一个简单例子所示，其实现的是对我们画面中的道路直线进行的检测：

import osimport reimport cv2import numpy as np

# 初始化一个掩膜def mask_create():    img = cv2.imread('0.png')    zero = np.zeros_like(img[:, :, 0])    poly = np.array([[50, 270], [220, 160], [345, 160], [480, 270]])    zero_fixed = cv2.fillConvexPoly(zero, poly, (255, 255, 255))    return zero_fixed
# 掩膜计算，传入的图像需要是BGR图def mask_calc(frame, mask):    img = cv2.bitwise_and(frame[:, :, 0], frame[:, :, 0], mask=mask)    return img
# 图像阈值操作，传入的图片需要是灰度图def threshold(low, high, img):    ret, thresh = cv2.threshold(img, low, high, cv2.THRESH_BINARY)    return thresh
# 对图像进行霍夫变换，输入的图像需要是二值图,距离r为1,旋转角为1度,投票阈值为30,最远距离为200像素# 并在原图上进行绘制图像def hough(thresh, img):    lines = cv2.HoughLinesP(thresh, 1, np.pi/180, 30, maxLineGap=200)    try:        for line in lines:            x1, y1, x2, y2 = line[0]            img = cv2.line(img, (x1, y1), (x2, y2), (255, 255, 255), 3)    except:        return img    else:        return img# 主函数def mainn():    # 读取数据    col_frames = os.listdir('../frames/')    # 排序    col_frames.sort(key=lambda f: int(re.sub('\D', '', f)))    # 读取画面每一帧    for i in col_frames:        img = cv2.imread(i)        # 构建一个掩膜        mask = mask_create()        # 对原图像进行掩膜计算        masked_frame = mask_calc(img, mask)        thresh = threshold(135, 255, masked_frame)        img = hough(thresh, img)        cv2.imshow('img', img)        if cv2.waitKey(40) == ord('q'):            break    cv2.destroyAllWindows()

mainn()

该代码对我们在frames这个文件夹下的图片进行直线检测（文件夹下的图片在源于行车记录仪所拍下的行车记录的部分采样），运行结果如下图所示。

本文到此为止，谢谢大家！



   

    

     来源：古月居
仅用于学术分享，版权属于原作者。
若有侵权，请联系微信号:yiyang-sy 删除或修改！



               

                

                 

                  —THE END—