Facebook AI指出:CNN的padding机制,存在一大缺陷
点击上方“AI算法与图像处理”,选择加"星标"或“置顶”
重磅干货,第一时间送达

来源:AI科技评论
欢迎大家来分享自己的学习成果和研究成功!投稿可加 nvshenj125
作者 | 青暮
1
神秘故障
padding如何导致空间偏差
图1:交通信号灯检测器的最后一个卷积层中每个输入和每个过滤器的平均特征图。颜色表示激活强度(越亮则越高),在地图上显示出伪影,这些伪影是空间偏差的表现。
图2:0输入的逐层激活特征图。
图3:每个卷积层的平均核,所有卷积核均为3×3,标题显示其核数量。
3
空间偏差的影响
图4:SSD中盲点的形成。预测器基于512个特征图,使用空间anchor在45×80个可能的位置上检测和定位目标。如二分图所示,某些anchor因特征图伪影而倾向于被预测为背景。如真实场景所示(底部中间),无法检测到相应位置的交通灯。
图5:(a)通过彩色显示SSD出现在各个位置时为交通信号灯计算的检测得分的图。当刺激位于受伪影影响的区域时,检测将失败。(b)将padding方法更改为mirror padding(SYMMETRIC)后的同一图。除了由于SSD依赖anchor而导致的周期性变化之外,检测得分相当稳定。
padding方法怎么选?
图8:在mirror padding下生成的特征图,并在30个随机生成的输入样本上取平均值。与图2 相比,由零值 padding引起的伪影大大减轻了。
表2:两种不同padding方案训练的SSD交通灯检测器的性能。
特征图统计:零值 padding会更改特征图中的值分布,并且可以在使用ReLU函数的情况下改变平均值。第6节中介绍的替代方法由于重用了特征图中的现有值,可以保留这种分布。
偏向行为(参见第6节):与circular padding和mirror padding不同,零值 padding可能不适合在边界需要高精度预测的任务。
干扰图像语义(尤其是填充量> 1个像素):例如,circular padding会引入边界不连续性,除非输入为全景。
诱发特征图伪影的可能性:除Distribution padding外,所有零值 padding的替代方法均会引起相对较少的伪影。
下载1:leetcode 开源书
在「AI算法与图像处理」公众号后台回复:leetcode,即可下载。每题都 runtime beats 100% 的开源好书,你值得拥有!
下载2 CVPR2020
在「AI算法与图像处理」公众号后台回复:CVPR2020,即可下载1467篇CVPR 2020论文 个人微信(如果没有备注不拉群!) 请注明:地区+学校/企业+研究方向+昵称
觉得不错就点亮在看吧
评论

