OpenCV :图像基本操作
新机器视觉
共 6311字,需浏览 13分钟
· 2022-04-25
点击下方卡片,关注“新机器视觉”公众号
重磅干货,第一时间送达
转自:AI技术前线
01
加载图像
imread 功能是加载图像文件成为一个 Mat 对象,其中第一个参数表示图像文件名称,第二个参数表示加载的图像是什么类型,支持常见的三个参数值
IMREAD_UNCHANDED(<0) 表示加载原图,不做任何改变
IMREAD_GRAYSCALE(0) 表示吧原图作为灰度图像加载进来
IMREAD_COLOR(>0) 表示把原图作为 RGB 图像加载进来
# 导入 OpenCV 库
import cv2 as cv
# 加载图像
img = cv.imread("./1.jpg")
# 打印图像类型
print(type(img))
print(img)
图像显示
# 导入 OpenCV 库
import cv2 as cv
# 加载图像
img = cv.imread("./1.jpg")
# 图像的显示,也可以创建多个窗口
cv.imshow("image",img)
# 等待时间,毫秒级,0 表示任意键终止
cv.waitKey(0)
cv.destroyAllWindows()
数据读取-图像
# 导入 OpenCV 库
import cv2 as cv
# 灰色显示
img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)
# 打印信息
print(img)
# 导入 OpenCV 库
import cv2 as cv
img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)
cv.imshow("image",img)
cv.waitKey(0)
cv.destroyAllWindows()
截取部分图像数据
# 导入 OpenCV 库import cv2 as cv# 加载图像img = cv.imread("./1.jpg",)# 截取部分图像cat = img[0:200, 0:200]# 显示截取的图像cv.imshow("cat",cat)cv.waitKey(0)cv.destroyAllWindows()
颜色通道提取
# 导入 OpenCV 库
import cv2 as cv
img = cv.imread("./1.jpg",)
b,g,r = cv.split(img)
print(b)
# 导入 OpenCV 库
import cv2 as cv
img = cv.imread("./1.jpg",)
cur_img = img.copy()
# 注意参数的变化
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv.imshow('R',cur_img)
cv.waitKey(0)
cv.destroyAllWindows()
# 导入 OpenCV 库
import cv2 as cv
img = cv.imread("./1.jpg",)
cur_img = img.copy()
# 注意参数的变化
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv.imshow('G',cur_img)
cv.waitKey(0)
cv.destroyAllWindows()
# 导入 OpenCV 库
import cv2 as cv
img = cv.imread("./1.jpg",)
cur_img = img.copy()
# 注意参数的变化
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv.imshow('B',cur_img)
cv.waitKey(0)
cv.destroyAllWindows()
# 导入 OpenCV 库
import cv2 as cv
# 导入 maplotlib
import matplotlib.pyplot as plt
img = cv.imread("./1.jpg",)
# 定义图片显示大小
top_size,buttom_size,left_size,right_size = (50,50,50,50)
# 复制法,也就是复制最边缘像素
replicate = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REPLICATE)
# 反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcbajabcdefghjhgfedcb
reflect = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REFLECT)
# 反射法,也就是以最边缘像素为轴、对称、gfedcbjabcdefghigfedcba
reflect01 = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_REFLECT_101)
# 外包装法 cdeifghjabcdefghjabcdefg
wrap = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_WRAP)
# 常量法,常数值填充
constant = cv.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv.BORDER_CONSTANT)
# 设置图像位置
plt.subplot(231)
# 设置图像显示
plt.imshow(img,'gray')
# 设置标题
plt.title('ORIGINAL')
plt.subplot(232)
plt.imshow(replicate,'gray')
plt.title("REPLICATE")
plt.subplot(233)
plt.imshow(reflect,'gray')
plt.title("REFLECT")
plt.subplot(234)
plt.imshow(reflect01,'gray')
plt.title("REPLICATE01")
plt.subplot(235)
plt.imshow(wrap,'gray')
plt.title("WRAP")
plt.subplot(236)
plt.imshow(constant,'gray')
plt.title("CONSTANT")
# 图像显示
plt.show()
BORDER_REPLICATE :复制法,也就是复制最边缘像素
BORDER_REFLECT :反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcbajabcdefghjhgfedcb(这里我也不是很明白,会的朋友请在评论区解释下,感谢)
BORDER_REFLECT_101 :反射法,也就是以最边缘像素为轴、对称、gfedcbjabcdefghigfedcba
BORDER_WRAP :外包装法 cdeifghjabcdefghjabcdefg
BORDER_CONSTANT :常量法,常数值填充
数值计算
import cv2 as cv
img = cv.imread("./1.jpg")
img2 = img + 10
img[:5,:,0]
print(img)
print("--------------------------")
print(img2)
图像融合
import cv2 as cv
img = cv.imread("./1.jpg")
img_cat = cv.imread("./2.jpg")
result = img + img_cat
print(result)
import cv2 as cv
img = cv.imread("./1.jpg")
img_cat = cv.imread("./2.jpg")
print(img.shape)
print(img_cat.shape)
import cv2 as cv
img = cv.imread("./1.jpg")
img_cat = cv.imread("./2.jpg")
print(img.shape)
# 设置与 img 一样的数值
img_cat = cv.resize(img_cat,(721,300))
print(img_cat.shape)
import cv2 as cv
import matplotlib.pyplot as plt
img = cv.imread("./1.jpg")
img_cat = cv.imread("./2.jpg")
# 设置与 img 一样的数值
img_cat = cv.resize(img_cat,(721,300))
# 设置宽度值
res = cv.addWeighted(img,0.4,img_cat,0.6,0)
# 图像显示
plt.imshow(res)
plt.show()
图像保存
# 导入 OpenCV 库
import cv2 as cv
# 读取图像
img = cv.imread("./1.jpg",cv.IMREAD_GRAYSCALE)
# 图像保存
# 第一个参数是图像要保存的路径,第二个图像是要保存的图像
cv.imwrite("./demo.jpg",img)
数据读取-视频
video = cv2.VideoCapture("demo.mp4")
# 检查是否打开正确
if video.isOpened():
# 我们都知道视频和游戏其实都是由图像组成的,通过访问图像的帧数连贯形成的,这里也是一样
# video.read() 一帧一帧地读取
# open 得到的是一个布尔值,就是 True 或者 False
# frame 得到当前这一帧的图像
open, frame = video.read()
else:
open = False
while open:
ret, frame = video.read()
# 如果读到的帧数不为空,那么就继续读取,如果为空,就退出
if frame is None:
break
if ret == True:
# 转换为灰度图
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow("video",gray)
# 这里使用 waitKey 可以控制视频的播放速度,数值越小,播放速度越快
# 这里等于 27 也即是说按下 ESC 键即可退出该窗口
if cv2.waitKey(10) & 0xFF == 27:
break
video.release()
cv2.destroyAllWindows()
import cv2
video = cv2.VideoCapture("./demo.mp4")
# 检查是否打开正确
if video.isOpened():
# 我们都知道视频和游戏其实都是由图像组成的,通过访问图像的帧数连贯形成的,这里也是一样
# video.read() 一帧一帧地读取
# open 得到的是一个布尔值,就是 True 或者 False
# frame 得到当前这一帧的图像
open, frame = video.read()
else:
open = False
while open:
ret, frame = video.read()
# 如果读到的帧数不为空,那么就继续读取,如果为空,就退出
if frame is None:
break
if ret == True:
# 转换为灰度图
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imshow("video",gray)
# 这里使用 waitKey 可以控制视频的播放速度,数值越小,播放速度越快
# 这里等于 27 也即是说按下 ESC 键即可退出该窗口
if cv2.waitKey(10) & 0xFF == 27:
break
video.release()
cv2.destroyAllWindows()
注释掉设置灰色的部分
将原视频显示在窗口上
本文仅做学术分享,如有侵权,请联系删文。
评论
盘点Lombok的几个骚操作,你绝对没用过!
👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目 2.0 版本完结啦, 演示链接:http://116.62.199.48/ ,新项目正在酝酿中
小哈学Java
0
我发现 Lombok的几个骚操作,哈哈好用
大家好,我是小富~前言本文不讨论对错,只讲骚操作。有的方法看看就好,知道可以这么用,但是否应用到实际开发中,那就仁者见仁,智者见智了。一万个读者就会有一万个哈姆雷特,希望这篇文章能够给您带来一些思考。耐心看完,你一定会有所收获。@onX例如 onConstructor, oMet
程序员内点事
0
让扩散模型听话的小秘籍?CAN:通过操控权重来控制条件生成模型,图像生成效率大升级!
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出的 CAN 模型 (Condition-Aware Neural Network) 是一种对图像生成模型添加控制的方法。CAN 可以通过动态操纵神经网络的权重来控制图像生成过程。作者在 ImageNet 图像
极市平台
0
牛逼啊,几乎涵盖了SpringCloud所有操作
前言Spring Cloud Alibaba为分布式应用开发提供了一站式解决方案。它包含开发分布式应用程序所需的所有组件,可以轻松地使用Spring Cloud开发应用程序。使用Spring Cloud Alibaba,只需添加一些注解和少量配置,即可将Spring Cloud应用连接到Alibab
java团长
0
GPT的风也吹到了CV,详解自回归视觉模型的先驱! ImageGPT:使用图像序列训练图像 GPT模型
作者丨科技猛兽编辑丨极市平台导读 在 CIFAR-10 上,iGPT 使用 linear probing 实现了 96.3% 的精度,优于有监督的 Wide ResNet,并通过完全微调实现了 99.0% 的精度,匹配顶级监督预训练模型。本文目录1 自回归视觉模型的先驱 ImageGPT:
机器学习初学者
0
使用 OpenCV 测量物体尺寸
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达你是否曾经遇到过这样的问题:想要知道计算器的精确尺寸,但手头又没有专业的测量工具?别担心,今天我们就来教大家一个简单又实用的方法,通过一张A4纸就能估算出计算器的宽度和高度,精确到毫米哦!该算法的主要思想其实非常简单。请看下面图
小白学视觉
10
图像处理基础知识
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达图像1、模拟图像模拟图像,又称连续图像,是指在二维坐标系中连续变化的图像,即图像的像点是无限稠密的,同时具有灰度值(即图像从暗到亮的变化值)。2、数字图像数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。数字图
小白学视觉
10
如何使用 Python比较两张图像并获得准确度?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文,将带你了解如何使用 Python、OpenCV 和人脸识别模块比较两张图像并获得这些图像之间的准确度水平。首先,你需要了解我们是如何比较两个图像的。我们正在使用Face Recognition python 模块来获取两张图
小白学视觉
10