使用Python+OpenCV进行图像处理之入门教程

小白学视觉

共 4284字,需浏览 9分钟

 ·

2020-12-27 19:01

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

简介

人脸识别和目标检测这样的术语听起来觉得很酷,但是当涉及到从头开始实现它们时,每个初学者都会觉得困难,这些技术实际上并没有那么难实现,一旦你掌握了其基本原理,那么实现它们就相当简单了。
图像处理有很多种应用,包括用于解析文档和生成相应文本的光学字符识别(OCR)、图像增强与重建、物体识别、人体运动识别、手势识别、人脸识别等。
在学习的过程中,你会遇到过奇形怪状的各种图像滤波器,那有没有去思考如何实现它吗,在本文中,我们将通过实现一个简单的滤波器来开始我们的图像处理之旅!

什么是OpenCV

OpenCV是一个开源库,包含了许多计算机视觉算法。它在计算机视觉和图像处理中起着重要作用,用于实时操作,其效率足以满足工业上的要求。OpenCV可以与其他库一起使用,比如Numpy,这使得Python能够处理OpenCV数组结构。

实现我们的第一个滤波器

检测逻辑

计算机不能像人类一样识别物体,为了能让计算机达到这个目的,我们可以使用各种技术来让计算机理解图像,我们会将颜色作为检测物体的主要依据。
我们使用HSV颜色空间作为检测特征。

什么是HSV

HSV是Hue, Saturation 和Value(色调、饱和度和值)。
  • 色调:根据光谱,物体的颜色可分为红、蓝、绿、黄四种颜色。
  • 饱和度:它定义了颜色的强度。
  • 值:定义颜色的亮度。
OpenCV中有150多种颜色空间转换方法,其中一种是彩色图像到HSV图像的转换。

我们来看看代码

我们需要导入我们要使用的库-OpenCV(cv2)和Numpy。
import cv2
import numpy as np
Numpy是一个python库,用于处理数组,它比传统的python列表快50倍,这对我们来说非常重要,因为我们要处理很多图像。Numpy给了我们在线性代数、傅立叶变换、矩阵等领域工作的函数。
import cv2
import numpy as np
def nothing():
  pass
cap=cv2.VideoCapture(0)
while(1):
  _, img = cap.read()
  k=cv2.waitkey(1)&0xFF
  if k==27:
    break
cap.release()
cv2.destroyAllWindows()
我们创建了一个回调函数,它什么也不做,让我们看看为什么。
我们使用一个窗口来控制HSV,因为我们不知道要检测的对象的HSV,因此我们用它来调整HSV的上下限。
因为当我们使用创建trackbar的方法时,我们需要传递一个必要的回调函数,在我们的例子中,这个回调函数什么也不做(但是它的使用会根据父函数的需要而改变);然后我们使用了一个方法cv2.videocapture(0),它是一个内置函数,用来从默认摄像机捕捉视频(0表示选择默认摄像机);最后,我们删除了所有的窗口,并在一个点击事件(这里我们设置为ESC键)后释放捕获。
我们可以用下面的函数命名一个窗口。
cv2.namedWindow()
让我们继续敲代码…
import cv2
import numpy as np
def nothing(x):
    pass
  
cap=cv2.VideoCapture(0)
cv2.namedWindow('tracking')
cv2.createTrackbar('LH','tracking',0,255,nothing)
cv2.createTrackbar('LS','tracking',0,255,nothing)
cv2.createTrackbar('LV','tracking',0,255,nothing)
cv2.createTrackbar('UH','tracking',255,255,nothing)
cv2.createTrackbar('US','tracking',255,255,nothing)
cv2.createTrackbar('UV','tracking',255,255,nothing)
因此,在设置检测条件后,我们需要将原始数据(即彩色图像)转换为HSV图像。为了将基本彩色图像转换为HSV图像,我们使用
 = cv2.cvtColor(,cv2.COLOR_BGR2HSV)
然后利用Numpy数组方法设置trackbar中数据的上下界。
 = np.array()
使用这个,我们会得到上面设置的所有轨迹条值。接下来我们主要做两件事:
1.创建掩码
掩码是一种二进制图像,它指示要在其中执行操作的像素。
2.我们将使用位和逻辑来屏蔽原始图像。我们使用名为“bitwise_and”的cv2方法,它执行逻辑与运算。
 = cv2.inRange(hav, l_b, u_b)

res = cv2.bitwise_and(, mask = )
import cv2
import numpy as np
def nothing(x):
    pass
cap=cv2.VideoCapture(0)

cv2.namedWindow('tracking')
cv2.createTrackbar('LH','tracking',0,255,nothing)
cv2.createTrackbar('LS','tracking',0,255,nothing)
cv2.createTrackbar('LV','tracking',0,255,nothing)
cv2.createTrackbar('UH','tracking',255,255,nothing)
cv2.createTrackbar('US','tracking',255,255,nothing)
cv2.createTrackbar('UV','tracking',255,255,nothing)

while (1):
    _, img=cap.read()
    hav=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
    l_h=cv2.getTrackbarPos('LH','tracking')
    l_s=cv2.getTrackbarPos('LS''tracking')
    l_v=cv2.getTrackbarPos('LV''tracking')
    u_h=cv2.getTrackbarPos('UH''tracking')
    u_s=cv2.getTrackbarPos('US''tracking')
    u_v=cv2.getTrackbarPos('UV''tracking')
    l_b=np.array([l_h,l_s,l_v])
    u_b=np.array([u_h,u_s,u_v])
    mask=cv2.inRange(hav, l_b, u_b)
    res = cv2.bitwise_and(img, img, mask=mask)
    cv2.imshow('image', img)
    cv2.imshow('mask', mask)
    cv2.imshow('res', res)
    k=cv2.waitKey(1)&0xFF
    if k==27:
        break
cap.release()
cv2.destroyAllWindows()
这些帧使用名为“imshow”的方法显示。
cv2.imshow()
结果
结果只检测到粉红色的物体,这是因为我们只想选择粉红色的物体!实际上,我们已经使用轨迹条为特定的粉红色设置了HSV值,这就是输出只有特定粉红色的原因。您可以选择要检测的任何特定颜色值。

结论

本文我们实现了一个滤波器,可以检测我们指定特定颜色的物体。我们所做的只是图像处理和目标检测的一个非常基本的介绍性任务。近年来,计算机视觉领域有了很大的发展,其中大部分都包含了机器学习和深度学习技术。在许多项目中,对象检测是首先执行的基本任务,因为它为我们提供了有关环境的信息,我们可以根据使用情况进行过滤。

参考引用

  • Implementing colour and shape-based object detection and tracking with OpenCV(https://hub.packtpub.com/implementing-color-and-shape-based-object-detection-and-tracking-with-opencv-and-cuda-tutorial/).
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目31讲
小白学视觉公众号后台回复:Python视觉实战项目31讲即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

下载4:leetcode算法开源书
小白学视觉公众号后台回复:leetcode即可下载。每题都 runtime beats 100% 的开源好书,你值得拥有!




交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 19
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报