AC-FPN:目标检测中的注意力机制
小白学视觉
共 817字,需浏览 2分钟
·
2020-09-15 22:40
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
Attention-guided Context Feature Pyramid Network for Object Detection
https://arxiv.org/pdf/2005.11475.pdf
https://github.com/Caojunxu/AC-FPN
在目标检测领域,图像输入越来越大(1333 * 800),但使用的特征提取网络还是图片分类时候的(224*224).
显然地,感受野已经“不太够用”了:因为看得见,所以会相信;如果看不见,那就乱来了。
为解决此问题,AC-FPN设计了一个新的网络结构,称为以注意力导向的上下文特征金字塔网络,该网络结构通过融合多路不同感受野特征,不仅增大物体感受野,而且还可以利用物体的上下文信息,更好得给出分类结果。
该模型主要包含两个模块:第一个是上下文提取模块(CEM),它从多个感受野中探索大量上下文信息,但冗余的上下文关系可能会误导定位以及识别,因此还设计了第二个模块,称为注意力引导模块(AM),该模块可以通过注意力机制来自适应提取显著对象周围的有用信息。AM由两个子模块组成,即上下文注意模块(CxAM)和内容注意模块(CnAM),它们分别用于捕获区分性语义信息和定位精确位置信息,从而得到更好的检测和分割结果。
AC-FPN可以轻松插入现有的基于FPN的模型中,在使用不到200行代码就可以提升FPN-resnet50近3mAP,在其他前沿框架也取得了很大的提升。
代码已经开源:https://github.com/Caojunxu/AC-FPN
评论