实战：使用 PyTorch 和 OpenCV 实现实时目标检测系统-技术圈

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

一、引言

自动驾驶汽车可能仍然难以理解人类和垃圾桶之间的区别，但这并没有使最先进的物体检测模型在过去十年中取得的惊人进步相去甚远。

将其与 OpenCV 等库的图像处理能力相结合，如今在数小时内构建实时对象检测系统原型要容易得多。在本指南中，我们将尝试向您展示如何开发用于简单对象检测应用程序的子系统，以及如何将所有这些组合在一起。

二、Python与C++

我知道你们中的一些人可能会想，为什么我们要使用Python，在某种程度上,它对于实时应用程序来说不是太慢了吗。

大多数计算重操作，如预测或图像处理，都是通过PyTrand和OpenCV来执行的，它们都使用C++在场景后面实现这些操作，因此，如果我们在这里使用C++或Python，则不会有太大的差别。

三、读取视频流

输入的视频源可以是任何内容，从网络摄像头读取，或解析现有视频，或从连接到网络的外部摄像头。在此示例中，我们将展示如何从 youtube 或网络摄像头读取视频流。

四、从YouTube读取

你们可能不想出去创建新视频，而是使用许多在线可用的视频。在这种情况下，你们可以从 youtube 读取视频流。

import cv2 # opencv2 package for python.import pafy # pafy allows us to read videos from youtube.URL = "https://www.youtube.com/watch?v=dQw4w9WgXcQ" #URL to parseplay = pafy.new(self._URL).streams[-1] #'-1' means read the lowest quality of video.assert play is not None # we want to make sure their is a input to read.stream = cv2.VideoCapture(play.url) #create a opencv video stream.

十二、结论

当然，生产级实时应用程序比这复杂得多，但本文并不打算教授这一点。它是为了展示 Python 的惊人力量，它使我们能够在数小时内构建如此复杂的应用程序原型。

Github代码链接：https://github.com/akash-agni

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

实战：使用 PyTorch 和 OpenCV 实现实时目标检测系统

现在我们将它们整合到一个调用函数中，在循环中执行整个操作，让我们回顾一下我们的主要功能必须执行以成功运行应用程序的步骤。