旋转角度目标检测的重要性!!!(附源论文下载)
点击下方“AI算法与图像处理”,一起进步!
重磅干货,第一时间送达
论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517
计算机视觉研究院专栏
作者:Edison_G
任意方向的目标检测是一项具有挑战性的任务。
三、新框架
新提出的旋转检测器框架如上图所示。网络基于RetinaNet框架。图中标记为C2、C3、C4的特征图是由深度卷积神经网络提取的。该方法的总体步骤如下:首先利用特征提取网络对遥感图像中的特征进行提取,利用NAS-FPN对提取的特征进行融合,得到不同尺度的特征图。然后,使用长边定义方法来表示旋转检测框,并在框回归任务中使用二进制编码标记技术将角度回归问题转化为角度分类问题。下面详细描述该方法中的一些重要结构。
NAS-FPN
在NAS-FPN中,最重要的结构是由特征图节点集合、操作池和搜索终止条件组成的合并单元结构。下图简要描述了特征图的搜索过程。
1)从特征图节点集中随机选择一个特征图作为输入之一。初始特征图节点集包含五个尺度的特征图,表示为 {C1,C2, C3, C4, C5}。
2)从特征图节点集中随机选择另一个特征图作为另一个输入。
3)选择输出特征图的分辨率。
4)在操作池中选择一个操作对(1)(2)中选择的特征图节点进行操作,产生与输出特征图分辨率相同的特征图,并将该特征图加入到特征图节点集合中选择。
5) 循环重复上述步骤。搜索的终止条件是生成五个与初始特征图分辨率相同的特征金字塔网络,记为{P1, P2, P3, P4, P5}。
ROTATION DETECTION FRAME
典型的角度编码方法有三种,包括两种不同角度范围的五参数方法和一种八参数方法。详细情况如下:
角度范围为90°的五参数法(OpenCV定义法):其示意图如上图所示。该定义法包含五个参数[x,y,w,h,θ]。其中,x和y为旋转坐标系的中心坐标,θ为旋转坐标系与x轴的锐角,逆时针方向指定为负角,因此角度范围为[−90° , 0); 旋转框的宽度w为旋转框所在的边角,旋转框的高度h为另一边。
180°角范围的五参数法
八参数法
八参数法:该定义方法示意图如上图所示,该定义方法包含8个参数[a1,a2,b1,b2,c1,c2,d1,d2], 定义的左上角为起点,其余点按逆时针顺序排列。旋转坐标系的表示不限于上述三种方法,旋转坐标系其余部分的表示可以通过上述三种方法的变换得到。
ANGLE CODING METHOD
90°范围的五参数定义方法的问题
八参数四边形定义方法的问题
角度编码方法:
四、实验及可视化
实验环境
DOTA数据集上的性能比较
交流群
欢迎加入公众号读者群一起和同行交流,目前有美颜、三维视觉、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群
个人微信(如果没有备注不拉群!) 请注明:地区+学校/企业+研究方向+昵称
下载1:何恺明顶会分享
在「AI算法与图像处理」公众号后台回复:何恺明,即可下载。总共有6份PDF,涉及 ResNet、Mask RCNN等经典工作的总结分析
下载2:终身受益的编程指南:Google编程风格指南
在「AI算法与图像处理」公众号后台回复:c++,即可下载。历经十年考验,最权威的编程规范!
下载3 CVPR2021 在「AI算法与图像处理」公众号后台回复:CVPR,即可下载1467篇CVPR 2020论文 和 CVPR 2021 最新论文