基于Python的颜色识别器
共 2445字,需浏览 5分钟
·
2020-10-02 10:07
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
在这篇文章中,我们将展示如何使用Python构建颜色识别器。此过程也称为“颜色检测”。我们将创建一个基本应用程序,该应用程序将帮助我们检测图像中的颜色。该程序还将返回颜色的RGB值。构建颜色识别器是Computer Vision中最基础的项目。
如果大家以前从未听说过Computer Vision,那么这是了解它的最佳时间。大多数机器学习和人工智能领域都与计算机视觉紧密相关。随着我们的发展和探索,看到外部世界对我们的发展具有重大影响。对于机器来说,情况也是如此,他们使用图像看到外界,并且这些图像被转换为计算机可以理解的数据值。
目录
• 入门
• 库
• 定义图片
• 颜色识别
• 应用
• 结果
我们将为此项目使用三个主要模块。它们是NumPy,Pandas和OpenCv。OpenCv是一个高度优化的库,专注于实时应用程序。
OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。OpenCV的构建旨在为计算机视觉应用程序提供通用的基础结构,并加速在商业产品中使用机器感知。
资料来源:https : //opencv.org
库
如前所述,我们将在此项目中使用三个模块。要使用这些模块,我们必须安装必要的库。使用pip安装库非常简单。Pip是程序包管理工具。我们将使用命令行界面进行安装。这是一次安装所有3个库的行:
pip install numpy pandas opencv-python
安装完成后,我们必须将它们导入到我们的程序中。在大家喜欢的代码编辑器中打开一个新文件。以下是有关如何导入已安装库的代码:
import numpy as np
import pandas as pd
import cv2
OpenCv导入为cv2。对于其他库,我们将它们“ as”导入,以便在程序中更轻松地调用它们。
完善!现在,我们可以进行下一步,在此步骤中,我们将定义要用于测试颜色识别器应用程序的图像。
定义图片
您可以选择任何想要的图像。我将图像保存在与程序相同的文件夹中,这使查找和导入更加容易。
img = cv2.imread("color_image.jpg")
为了给您一些想法,这是我将用于此项目的图像:
大家准备好进行一些编程了吗?让我们继续下一步。
颜色识别
我问大家一个好问题。小伙伴们知道机器就相当于一张白纸吗?我们认为是因为他们学到了教给他们的东西。
教授色彩
首先,我们必须教给他们什么是颜色。为此,我们需要包含颜色名称和一些与这些颜色匹配的值的数据。由于大多数颜色都可以使用红色,绿色和蓝色定义。这就是为什么我们将RGB格式用作数据点的原因。我找到了一个准备就绪的csv文件,其中包含大约1000个颜色名称和RGB值。下面是相关链接:
https://github.com/codebrainz/color-names/blob/master/output/colors.csv
我们将在程序中使用此csv文件。该文件的屏幕截图可让您有所了解:
colors.csv
让我们使用read_csv方法将colors.csv文件导入到我们的程序中。由于我们下载的csv文件没有列名,因此我将在程序中定义它们。此过程称为数据处理。
index=["color", "color_name", "hex", "R", "G", "B"]csv = pd.read_csv('colors.csv', names=index, header=None)
全局变量
在以下步骤中,我们将定义两个函数。为了使应用程序顺利运行,我们需要一些全局变量。大家将了解全局变量在使用函数时是如何帮助大家的。
clicked = False
r = g = b = xpos = ypos = 0
颜色识别功能
当我们双击图像的某个区域时,将调用此函数。它将返回颜色名称和该颜色的RGB值。这就是神奇的地方!
def recognize_color(R,G,B):
minimum = 10000
for i in range(len(csv)):
d = abs(R- int(csv.loc[i,"R"])) + abs(G- int(csv.loc[i,"G"]))+ abs(B- int(csv.loc[i,"B"]))
if(d<=minimum):
minimum = d
cname = csv.loc[i,"color_name"]
return cname
鼠标点击功能
此函数用于定义我们的双击过程。在创建应用程序部分时,我们将需要它。
def mouse_click(event, x, y, flags, param):
if event == cv2.EVENT_LBUTTONDBLCLK:
global b,g,r,xpos,ypos, clicked
clicked = True
xpos = x
ypos = y
img[y,x] =
b = int(b)
g = int(g)
r = int(r)
希望大家继续和我在一起!看起来可能有些复杂,但是当我们开始在编辑器中编写它们时,大局就会显现出来。我们尽量使事情变得简单易懂。
应用
很高兴大家能完成此步骤。在这一步中,我们将使用OpenCV方法将图像作为新窗口打开。在该窗口中,我们将使用我们先前定义的功能。该应用程序非常简单,当我们双击图像上的某个区域时,它将返回颜色名称和颜色值。
应用窗口
首先,让我向大家展示如何使用OpenCV将图像文件作为新窗口打开。
cv2.namedWindow('Color Recognition App')
其次,让我们调用我们创建的鼠标单击功能。这为我们的应用程序提供了更多功能。
cv2.setMouseCallback('Color Recognition App',mouse_click)
应用程序
这是while循环,用于启动我们的应用程序窗口。
while(1):
cv2.imshow("Color Recognition App",img)
if (clicked):
#cv2.rectangle(image, startpoint, endpoint, color, thickness)-1 fills entire rectangle
cv2.rectangle(img,(20,20), (750,60), (b,g,r), -1)
#Creating text string to display( Color name and RGB values )
text = recognize_color(r,g,b) + ' R='+ str(r) + ' G='+ str(g) + ' B='+ str(b)
#cv2.putText(img,text,start,font(0-7),fontScale,color,thickness,lineType )
cv2.putText(img, text,(50,50),2,0.8,(255,255,255),2,cv2.LINE_AA)
#For very light colours we will display text in black colour
if(r+g+b>=600):
cv2.putText(img, text,(50,50),2,0.8,(0,0,0),2,cv2.LINE_AA)
clicked=False
关闭申请
如果您使用过OpenCV项目,则可能熟悉此步骤。我们必须定义如何结束和关闭应用程序窗口。否则,它将因为我们使用while(1)启动应用程序而永远运行。添加以下行是您未来项目的一个好习惯。
#Break the loop when user hits 'esc' key
if cv2.waitKey(20) & 0xFF ==27:
break
cv2.destroyAllWindows()
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~