图像尺寸为 7*7, 卷积窗口大小为3*3, 步长为3, 是否能输出图像?

七月在线实验室

共 1392字,需浏览 3分钟

 ·

2021-02-05 08:51

文 | 七月在线
编 | 小七


解析:


答案:根据计算公式(W-F+2P)/S + 1    P=2时输出为3X3 


                                                                            

卷积层尺寸的计算原理

输入矩阵格式:四个维度,依次为:样本数(batch size)、图像高度、图像宽度、图像通道数   
输出矩阵格式:与输入矩阵的维度顺序和含义相同,但是后三个维度(图像高度、图像宽度、图像通道数)的尺寸发生变化。

权重矩阵(卷积核)格式:同样是四个维度,但维度的含义与上面两者都不同,为:卷积核高度、卷积核宽度、深度、卷积核个数(输出通道数); 高度和宽度即kernel size, 深度无需指定 默认为上一层特征图的通道数,卷积核个数决定卷积后输出特征图的通道个数。       

输入矩阵、权重矩阵、输出矩阵这三者之间的相互决定关系 :

卷积核的输入通道数(in depth)由输入矩阵的通道数所决定。    

输出矩阵的通道数(out depth)由卷积核的输出通道数所决定 。   

 输出矩阵的高度和宽度(height, width)这两个维度的尺寸由输入矩阵、卷积核、stride大小共同决定, 计算公式如下。 
       

标准卷积计算举例   
             

以 AlexNet 模型的第一个卷积层为例 计算如上图所示,- 输入图片的尺寸统一为 227 x 227 x 3 (高度 x 宽度 x 颜色通道数),- 共具有96个卷积核,- 每个卷积核的尺寸都是 11 x 11 x 3,3为上一层的通道数 可以不指定- 已知 stride = 4, padding = 0,- 假设 batch_size = 256,- 则输出矩阵的高度/宽度为 (227 - 11) / 4 + 1 = 55 ;如果遇到无法整除的情况,则向上取整- 因为有96个卷积核 所以输出通道数为96  

参数计算:上述过程的参数量计算方式:11*11*3*9611*11是卷积核的大小,3是输入通道个数,96是卷积核个数。卷积采用参数共享机制,每个通道上卷积参数完全一样,不同卷积核以及不同通道之间参数不同;一个卷积核对应输出特征图的一个通道,具体计算过程可以参考下图:                
                                
该图来源于cs231n课程,参数大小和上图有差别,但计算方式一样。蓝色表示原图共3个通道,红色表示卷积核共2个, 绿色表示输出;卷积核的深度d和输入维度一致且d[0],d[1],d[2]的参数是不一样的,每个卷积核对应一个输出特征图且之间的参数也不一样的。

因此参数量为:卷积核宽度 * 卷积核高度 * 输入通道数 * 卷积核个数

干货福利 · AI 资料大礼包

<<  滑动查看更多干货  >>


关注微信公众号"七月在线实验室",点击底部菜单栏 ”干货福利“,即可获得 60 G AI 学习大礼包!

您看此文用

  · 

秒,转发只需1秒呦~


浏览 60
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报