在目标检测被“遗忘”领域进行探索后，百度开源最新力作UMOP：即插即用、无痛涨点-技术圈

↑ 点击蓝字关注极市平台

作者丨happy

编辑丨极市平台

极市导读

百度开源了一项即插即用的一阶段检测器模块，主要是对金字塔层级目标分布不平衡进行的探索，所提模型在COCO test-dev数据集上取得了截至目前最高的55.1AP指标(一阶段检测器)。>>加入极市CV技术交流群，走在计算机视觉的最前沿

文章链接：https://arxiv.org/pdf/2109.07217.pdf

代码链接：https://github.com/zimoqingfeng/UMOP

本文是百度的研究员在目标检测领域的最新力作，对一个被“遗忘”的地带(金字塔层级目标分布不平衡)进行了探索。首先，作者基于FPN架构对不同检测器的不同层级目标分布进行了分析并得出：不同层级目标分布确实存在Level Imbalance问题；基于所发现问题，从现有固定参数FocalLoss出发设计了一种新的PFL损失；与此同时，针对训练过程中难易样例的角色转换现象提出了渐进式动态调整超参的机制进行更进一步的改善。值得一提的是，所提UMOP一种“即插即用”、“无损涨点”的模块，它可以轻易的嵌入到现有一阶段检测器中并大幅提升检测性能，性能提升高达~1.5AP。不得不说，百度最近两年最detection方面的工作还是非常值得称道的，顶！

Abstract

在目标检测领域，多级预测(比如FPN、YOLO)与重采样技术(如Focal Loss、ATSS)极大的提升了一阶段检测器性能。然而，如何通过逐级优化特征金字塔提升性能尚未进行探索。我们发现：在训练过程中，不同金字塔层级的正负样例比例是不同的，即存在Level Imbalance，而这尚未被一阶段检测器解决。

为缓解Level Imbalance影响，本文提出一种UMOP(Unified Multi-level Optimization Paradigm)，它包含两个成分：

- 基于不同层级目标重采样考量，对每个层级特征添加独立分类损失进行监督

- 提出一种跨金字塔层级的难例挖掘损失，且不会引入额外的层级相关设置

基于所提即插即用UMOP机制，现有一阶段检测可以用更少的训练迭代次数取得~1.5AP指标提升，且不会导致额外的计算负担。所得最佳模型在COCO test-dev数据集上取得了55.1AP指标。

本文主要由以下三点贡献：

本文首次证实：FPN性能在某种程度上会受到Level Imbalanced影响；
集成与所提UMOP，现有一阶段检测器可以用更少的训练迭代次数取得~1.5AP指标提升，且不会导致额外的计算负担；
在COCO test-dev数据集上，最佳模型取得了截至目前最高的55.1AP指标(一阶段检测器)。

The Statistical on Level Imbalance

在目标检测领域，多级架构在一阶段检测器中被广泛应用并极大提升了检测性能。在SSD与YOLO系列中，多级预测框架通过提供更多的稠密候选显著提升了检测器性能。与SSD和YOLO不同，FPN还引入了自顶而下的路径进行特征聚合。接下来，我们将从更广义视角对anchor-based与anchor-free检测的Level Imbalance问题进行确认。

The experiment settings on level imbalance不失一般性，我们分别以两种检测器(Anchor-based: RetineNet, ATSS, Anchor-free: FCOS, VFNet)进行分析，我们以MSCOCO作为基准数据，对C3-C5添加FPN生成P3-P7五种不同分辨率特征，见上图b和c。与此同时，我们固定所有其他设置以确保公平对比。

The statistical analysis on level imbalance 在分析过程中，我们精心的对不同层级的目标分布影响进行分析，同时确保图像分辨率与模型复杂度固定。