↑ 点击蓝字关注极市平台

作者丨时晴

来源丨炼丹笔记

编辑丨极市平台

极市导读

池化Pooling是卷积神经网络中常见的一种操作，Pooling层是模仿人的视觉系统对数据进行降维，其本质是降维。本文总结了9大池化操作，助力各位的炼丹之路～ >>加入极市CV技术交流群，走在计算机视觉的最前沿

简介

池化Pooling是卷积神经网络中常见的一种操作，Pooling层是模仿人的视觉系统对数据进行降维，其本质是降维。在卷积层之后，通过池化来降低卷积层输出的特征维度，减少网络参数和计算成本的同时，降低过拟合现象。

池化Pooling

01 最大/平均池化Max/Average Pooling

最大池化（Max Pooling）是将输入的图像划分为若干个矩形区域，对每个子区域输出最大值。即，取局部接受域中值最大的点。同理，平均池化（Average Pooling）为取局部接受域中值的平均值。

02 全局池化Global Pooling

Global Pooling就是Pooling的滑窗size和整个Feature Map的size一样大。在滑窗内的具体pooling方法可以是任意的，所以就会被细分为Global Average Pooling，Global Max Pooling等。

03 随机池化Stochastic pooling

Stochastic pooling是论文《Stochastic Pooling for Regularization of Deep Convolutional Neural Networks》中提到的一种池化策略，大意是只需对特征区域元素按照其概率值大小随机选择，元素值大的被选中的概率也大。

04 Mix Pooling

Mix Pooling是同时利用最大值池化Max Pooling与均值池化Average Pooling两种的优势而引申的一种池化策略。常见的两种组合策略：拼接Cat与叠加Add。

05 Soft Pool

SoftPool是一种变种的Pooling，它可以在保持池化层功能的同时尽可能减少池化过程中带来的信息损失。上图展示了SoftPool操作的Forward阶段与Backward阶段，6*6大小的区域表示的是激活映射a。

06 Local Importance-based Pooling

Local Importance-based Pooling提出通过一个基于输入特征的子网络自动学习重要性。它能够自适应地确定哪些特征更重要，同时在采样过程中自动增强识别特征。具体思路是，在原feature map上学习一个类似于attention的map，然后和原图进行加权求平均。需要说明的是，这里采样的间隔其实还是固定的，不符合上述描述的第一条，但是作者认为，由于importance是可变，从而实现变形的感受野。