为什么图片识别要将彩色图像灰度化?
点击下面卡片关注“AI算法与图像处理”,选择加"星标"或“置顶”
重磅干货,第一时间送达
先前在为大家介绍OCR识别技术时,在图像预处理部分提到了灰度化,大家可能会产生疑惑:为什么做图片识别要将彩色图像灰度化呢?
正式解释这个问题之前,我们需要了解,什么是灰度化?
简单地说,灰度化处理就是将一幅彩色图像转化为灰度图像的过程。
当我们在电脑、电视、或手机等显示器上显示彩色时,RGB模型是为达到目的而较为常用的一种彩色信息表达方式。
RGB模型也称为加色混色模型,是以R(红)G(绿)B(蓝)三色光互相叠加来实现混色的方法,尤其适用于显示器等发光物体。
而灰度化就是使彩色图像的R、G、B分量相等的过程,即令R=G=B,此时的彩色表示的就是灰度颜色。
会使用Photoshop的小伙伴可以打开颜色设置,令R=G=B,会发现随着数值的变化而出现明暗不同的灰色。
当R=G=B=255时,灰度值达到最高,显示为白色,反之则显示为黑色。
不会Photoshop的小伙伴们可以尝试用另一个方法来体会:当我们使用微信对屏幕进行截屏时,仔细观察鼠标下方的文字,会发现显示有当前鼠标所指位置的RGB值。如下图:
对下图的彩色和灰色部分分别进行RGB值查看,会发现彩色部分R、G、B值各有不同,而灰色部分则仅有灰度值的变化。
图:来源于网络
上文说到了将彩色图像转化为灰度图像的过程就是图像的灰度化处理过程。
图像灰度化的目的是为了简化矩阵,提高运算速度。
彩色图像中的每个像素颜色由R、G、B三个分量来决定,而每个分量的取值范围都在0-255之间,这样对计算机来说,彩色图像的一个像素点就会有256*256*256=16777216种颜色的变化范围!
而灰度图像是R、G、B分量相同的一种特殊彩色图像,对计算机来说,一个像素点的变化范围只有0-255这256种。
彩色图片的信息含量过大,而进行图片识别时,其实只需要使用灰度图像里的信息就足够了,所以图像灰度化的目的就是为了提高运算速度。
当然,有时图片进行了灰度处理后还是很大,也有可能会采用二值化图像(即像素值只能为0或1)。
图像灰度化处理主要有以下几种方式:
1. 分量法
将彩色图像中的三分量的亮度作为三个灰度图像的灰度值,可根据应用需要选取一种灰度图像。
图:来源于网络
2. 最大值法
将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。
图:来源于网络
3. 平均值法
将彩色图像中的三分量亮度求平均得到一个灰度值。
图:来源于网络
4. 加权平均法
根据重要性及其它指标,将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对RGB三分量进行加权平均能得到较合理的灰度图像。
图:来源于网络
对于以上四种处理方式,可根据实际需要进行选择。下图为分别使用四种方法得到的不同效果。
图:来源于网络
参考文献:
https://www.cnblogs.com/finlay/p/3665302.html
https://mp.weixin.qq.com/s/FWU0jVv8JH3qjsbfbkUXdw
End
声明:部分内容来源于网络,仅供读者学术交流之目的。文章版权归原作者所有。如有不妥,请联系删除。
点击上方卡片,关注我们
个人微信(如果没有备注不拉群!) 请注明:地区+学校/企业+研究方向+昵称
下载1:何恺明顶会分享
在「AI算法与图像处理」公众号后台回复:何恺明,即可下载。总共有6份PDF,涉及 ResNet、Mask RCNN等经典工作的总结分析
下载2:终身受益的编程指南:Google编程风格指南
在「AI算法与图像处理」公众号后台回复:c++,即可下载。历经十年考验,最权威的编程规范!
下载3 CVPR2021 在「AI算法与图像处理」公众号后台回复:CVPR,即可下载1467篇CVPR 2020论文 和 CVPR 2021 最新论文
点亮 ,告诉大家你也在看