图像尺寸为 7*7, 卷积窗口大小为3*3, 步长为3, 是否能输出图像?
文 | 七月在线
编 | 小七
解析:
答案:根据计算公式(W-F+2P)/S + 1 P=2时输出为3X3
卷积层尺寸的计算原理
输入矩阵格式:四个维度,依次为:样本数(batch size)、图像高度、图像宽度、图像通道数
输出矩阵格式:与输入矩阵的维度顺序和含义相同,但是后三个维度(图像高度、图像宽度、图像通道数)的尺寸发生变化。
权重矩阵(卷积核)格式:同样是四个维度,但维度的含义与上面两者都不同,为:卷积核高度、卷积核宽度、深度、卷积核个数(输出通道数); 高度和宽度即kernel size, 深度无需指定 默认为上一层特征图的通道数,卷积核个数决定卷积后输出特征图的通道个数。
输入矩阵、权重矩阵、输出矩阵这三者之间的相互决定关系 :
卷积核的输入通道数(in depth)由输入矩阵的通道数所决定。
输出矩阵的通道数(out depth)由卷积核的输出通道数所决定 。
输出矩阵的高度和宽度(height, width)这两个维度的尺寸由输入矩阵、卷积核、stride大小共同决定, 计算公式如下。
标准卷积计算举例
以 AlexNet 模型的第一个卷积层为例 计算如上图所示,- 输入图片的尺寸统一为 227 x 227 x 3 (高度 x 宽度 x 颜色通道数),- 共具有96个卷积核,- 每个卷积核的尺寸都是 11 x 11 x 3,3为上一层的通道数 可以不指定- 已知 stride = 4, padding = 0,- 假设 batch_size = 256,- 则输出矩阵的高度/宽度为 (227 - 11) / 4 + 1 = 55 ;如果遇到无法整除的情况,则向上取整- 因为有96个卷积核 所以输出通道数为96
参数计算:上述过程的参数量计算方式:11*11*3*9611*11是卷积核的大小,3是输入通道个数,96是卷积核个数。卷积采用参数共享机制,每个通道上卷积参数完全一样,不同卷积核以及不同通道之间参数不同;一个卷积核对应输出特征图的一个通道,具体计算过程可以参考下图:
该图来源于cs231n课程,参数大小和上图有差别,但计算方式一样。蓝色表示原图共3个通道,红色表示卷积核共2个, 绿色表示输出;卷积核的深度d和输入维度一致且d[0],d[1],d[2]的参数是不一样的,每个卷积核对应一个输出特征图且之间的参数也不一样的。
因此参数量为:卷积核宽度 * 卷积核高度 * 输入通道数 * 卷积核个数
干货福利 · AI 资料大礼包
<< 滑动查看更多干货 >>
关注微信公众号"七月在线实验室",点击底部菜单栏 ”干货福利“,即可获得 60 G AI 学习大礼包!
您看此文用
秒,转发只需1秒呦~
评论