干货|10 大 PyTorch 最常用的转换函数
共 4706字,需浏览 10分钟
·
2021-06-13 09:04
极市导读
当我们要处理多种类型的数据时,数据可能不是我们所需要的格式,PyTorch转换就是救星。本文介绍了10个PyTorchPyTorch最常用的转换函数。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
Pytorch是一个深度学习框架,广泛用于图像分类、分割、目标识别等各种任务。在这种情况下,我们必须处理各种类型的数据。很可能在大多数情况下,数据可能不是我们所需要的格式。PyTorch转换就是救星。torchvision.transforms模块提供了可以使用的各种图像转换。我们使用变换对数据进行一些操作,使其适合于训练torchvision模块,PyTorch为常见的图像变换提供变换有关的函数。这些变换可以使用Compose链接在一起。让我们在本文中看看其中的几个!准备好了吗?
1. ToTensor
这是一个非常常用的转换。在PyTorch中,我们主要处理张量形式的数据。如果输入数据是NumPy数组或PIL图像的形式,我们可以使用ToTensor将其转换为张量格式。最后一个张量的形式是(C * H * W)。同时,还执行从0–255到0–1的范围内的缩放操作。让我们用一个例子来更好地理解它。在这个博客中,我将使用Ragnar(我最喜欢的虚构角色)的图像来执行转换。
2. Normalize
此操作将获取张量图像,并使用平均值和标准差对其进行归一化。它有3个参数:mean, std, inplace。我们需要为3个通道提供一系列平均值,作为参数“mean”,“std”类似。如果将“inplace”设为True,则将计算得到的值覆盖之前的值。
torchvision.transforms.Normalize([meanOfChannel1, meanOfChannel2, meanOfChannel3], [stdOfChannel1, stdOfChannel2, stdOfChannel3])
#Example:
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
3. CenterCrop
这将在中心裁剪给定的张量图像。你可以以(高度、宽度)的形式向transforms.CenterCrop()提供要裁剪的大小作为输入。让我们在图像上实现这个并进行检查。
transform = transforms.Compose([transforms.ToTensor(),transforms.CenterCrop((200,100))])
tensor_img = transform(image)
tensor_img.shape
Output: torch.Size([3, 200, 100])
如果只提供一个尺寸标注而不是两个尺寸标注,会发生什么情况?它将假设它是一个正方形,并且将生成一个(size, size))的裁剪。如果给定的尺寸比原来的尺寸大呢?沿着这些边,图像将填充0!
4. RandomHorizontalFlip
此变换将以给定的概率水平(随机)翻转图像。你可以通过参数“p”来设置这个概率。p的默认值为0.5。检查我下面的例子来理解。
transform = transforms.Compose([transforms.RandomHorizontalFlip(p=0.9)])
tensor_img = transform(image)
tensor_img
查看原始图像和翻转的图像!
5. RandomRotation
此变换将图像随机旋转一个角度。以度为单位的角度可以作为参数“degrees”的输入。
transform = transforms.Compose([transforms.RandomRotation(degrees=180)])
tensor_img = transform(image)
tensor_img
查看上述代码的转换!
6. Grayscale
此转换将把原始RGB图像更改为灰度(即黑白)。你可以提供你想要多少个通道作为参数“num_output_channels”的输入。
transform = transforms.Compose([transforms.Grayscale(num_output_channels=1)])
tensor_img = transform(image)
tensor_img
输出如下所示。
7. GaussianBlur
在这里,图像将被随机选择的高斯模糊所模糊。必须提供参数kernel_size。
transform = transforms.Compose([transforms.GaussianBlur(kernel_size=501)])
tensor_img = transform(image)
tensor_img
8. RandomApply
此转换将随机应用给定的转换列表。
transform = transforms.RandomApply([transforms.RandomSizedCrop(200),transforms.RandomHorizontalFlip()],p=0.6)
tensor_img = transform(image)
9. Compose
在本文中,我们一直在使用Compose() 。为了清楚地定义它,它将几个变换组合在一起。
transforms.Compose([transforms.Grayscale(1),transforms.CenterCrop(10), transforms.ToTensor()])
一些转换将以所需格式处理数据。然而,对于图像数据增强,则需要灰度、随机水平翻转和随机旋转等变换。
10. 函数变换
在我们学习到的所有变换中,你可以注意到参数是随机生成的。这通常足以进行数据扩充。但是,有时你可能需要对转换管道进行更细粒度的控制。在这种情况下,可以使用函数变换。在这里,你可以指定或生成所有参数。一个附加的优点是,一个特定定义的函数变换可以应用于多个图像。可以从torchvision.transforms.functional访问所有函数转换。现在让我们深入了解PyTorch提供的不同功能转换。
A) 调整亮度:adjust_brightness
这主要是调整图像的亮度。它以PyTorch张量的形式将图像作为输入。它还有一个重要参数“亮度系数”。这将表示如何实际更改亮度。例如,如果值为1,则会得到与输入相同的图像。如果该值大于1,将获得更亮的图像。如果它小于1,你会得到一个更暗的图像。可以相应地传递浮点值。返回的图像将是张量或PIL图像。
new_img = transforms.functional.adjust_brightness(image,brightness_factor=2)
new_img
B) 调整对比度:adjust_contrast
上面我们看到了如何调整亮度,这里我们有另一个用于调整图像对比度的变换。它需要两个输入参数:张量形式的图像和“对比度因子”。第二个参数将输入一个浮点值,它将告诉你如何调整对比度。但不能是负的。
new_img = transforms.functional.adjust_contrast(image,contrast_factor=3.8)
new_img
C) 调整色调:adjust_hue
色调是图像的一个重要属性。Pytorch允许你通过transforms.functional.adjust_hue进行调整。想知道它是怎么工作的吗?首先,图像将被转换成HSV(色调,饱和度,值)形式。将根据我们的参数在H通道中进行更改。更改后,图像将转换为其原始形式。重要的参数是“色调因子”。它可以是[-0.5.0.5]范围内的浮点值。尝试实现下面的示例。
new_img = transforms.functional.adjust_hue(image,hue_factor=0.3)
new_img
D) 调整饱和度:adjust_saturation
这是为了调整输入图像的颜色饱和度。与上述情况类似,我们有一个“饱和度系数”参数,它决定了饱和度的变化方式。这将输入一个浮点值。如果将其设置为0,则会得到黑白图像。
new_img = transforms.functional.adjust_saturation(image,saturation_factor=6)
输出如下图所示!
E) 调整锐度:adjust_sharpness
你可以通过此变换调整图像的清晰度。它采用浮点值作为“锐度系数”参数的输入。此值可以是除负值以外的任何值。在下面的代码中,我使用了10的锐度因子,这意味着变换后的图像将是原始图像的10倍锐度。
new_img = transforms.functional.adjust_sharpness(image,sharpness_factor=10)
检查输出!
F) 均衡:equalize
这种变换将均衡图像的直方图。怎么会这样?它将对输入应用非线性映射,从而在输出中创建灰度值的均匀分布。
new_img = transforms.functional.equalize(image)
这些是一些重要的函数转换,将有助于在图像预处理阶段。它们也可以组合使用。
如果觉得有用,就请分享到朋友圈吧!
公众号后台回复“79”获取CVPR 2021:TransT 直播链接~
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~