做目标检测,这6篇就够了:CVPR 2020目标检测论文盘点
共 5114字,需浏览 11分钟
·
2020-07-30 13:41
目标检测是计算机视觉中的经典问题之一。凭借大量可用数据、更快的 GPU 和更好的算法,现在我们可以轻松训练计算机以高精度检测出图像中的多个对象。
A Hierarchical Graph Network for 3D Object Detection on Point Clouds
HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection
Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud
Camouflaged Object Detection
Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector
D2Det: Towards High-Quality Object Detection and Instance Segmentation
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Chen_A_Hierarchical_Graph_Network_for_3D_Object_Detection_on_Point_CVPR_2020_paper.pdf
具体而言,该研究提出了新的 shape-attentive GConv (SA-GConv),它能通过建模点的相对几何位置来描述物体的形状,进而捕获局部形状特征。
基于 SA-GConv 的 U 形网络捕获多层次特征,通过改进的投票模块(voting module)将这些特征映射到相同的特征空间中,进而生成候选框(proposal)。
基于 GConv 的 U 形网络(GU-net);
候选框生成器;
候选框推理模块(ProRe Module):使用全连接图对候选框进行推理。
该研究提出的模型主要以 VoteNet 作为 backbone,并基于它提出了一系列改进。
由下图可以看出:
将 VoteNet 中的 PointNet++ 换成特征捕捉能力更强的 GCN;
为 up-sample 的多层中的每一层都接上 voting 模块,整合多个尺度的特征;
在 proposal 之间也使用 GCN 来增强特征的学习能力。
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Ye_HVNet_Hybrid_Voxel_Network_for_LiDAR_Based_3D_Object_Detection_CVPR_2020_paper.pdf
体素化:将点云指定给二维体素网格;
体素特征提取:计算网格相关的点级特征,然后将其输入到 PointNet 风格特征编码器;
投影:将点级特征聚合为体素级特征,并投影到其原始网格。这就形成了一个伪图像特征图。
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Shi_Point-GNN_Graph_Neural_Network_for_3D_Object_Detection_in_a_CVPR_2020_paper.pdf
项目地址:
https://github.com/WeijingShi/Point-GNN
该研究指出,以往使用 CNN 的方法处理点云数据时往往需要在空间划分 Grids,会出现大量的空白矩阵元素,并不适合稀疏点云;
近来出现的类似 PointNet 的方法对点云数据进行分组和采样,取得了不错的结果,但计算成本太大。于是该研究提出一种新型 GNN 网络——Point-GNN。
图构建:使用体素降采样点云进行图构建;
GNN 目标检测(T 次迭代);
边界框合并和评分。
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Fan_Camouflaged_Object_Detection_CVPR_2020_paper.pdf
项目地址:
https://github.com/DengPingFan/SINet/
此外,该研究还创建了一个名为 COD10K 的新型数据集。它包含 10,000 张图像,涵盖许多自然场景中的伪装物体。
该数据集具有 78 个类别,每张图像均具备类别标签、边界框、实例级标签和抠图级(matting-level)标签。
搜索模块(SM),用于搜索伪装的物体;
识别模块(IM),用于检测该物体。
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Fan_Few-Shot_Object_Detection_With_Attention-RPN_and_Multi-Relation_Detector_CVPR_2020_paper.pdf
该研究提出一个新型注意力网络,能在 RPN 模块和检测器上学习 support set 和 query set 之间的匹配关系;
下图中的 weight shared network 有多个分支,可以分为两类,一类用于 query set,另一类用于 support set(support set 的分支可以有多个,用来输入不同的 support 图像,图中只画了一个),处理 query set 的分支是 Faster RCNN 网络。
论文地址:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Cao_D2Det_Towards_High_Quality_Object_Detection_and_Instance_Segmentation_CVPR_2020_paper.pdf
项目地址:
https://github.com/JialeCao001/D2Det
这篇论文提出了一种提高定位精度和分类准确率的方法 D2Det,以提升目标检测的效果。
针对这两项挑战,该研究分别提出了 dense local regression(DLR)和 discriminative RoI pooling(DRP)两个模块。
其中 DLR 与 anchor-free 方法 FCOS 的 detect loss 类似,DRP 则是利用了 deformable convolution 的思想,分别从第一阶段和第二阶段提取准确的目标特征区域,进而获得相应的性能提升。具体方法流程如下图所示:
计算机视觉顶会 CVPR 2020 提供了很多目标检测等领域的研究论文,如果你想获取更多论文信息,请点击以下网址:
https://openaccess.thecvf.com/CVPR2020
一网打尽:从 Mask RCNN到Yolo v4
共6大实战项目
课程大纲如下
CV博士授课
在售价399元的课程,今天大家可以使用优惠券按照299元购买,有兴趣的小伙伴抓紧抢购,先报先占位!
优惠券: 645A777EDB
购买流程:
复制优惠券>扫描二维码>点击直接购买>点击优惠券>输入优惠券
扫码抢占名额???
(报名过程中,有任何问题请加客服微信:julyedukefu12)
戳↓↓“阅读原文”查看课程详情!