FCOS 的改进 trick

极市平台

共 1960字,需浏览 4分钟

 · 2020-10-19

↑ 点击蓝字 关注极市平台

作者丨BigBoss
来源丨https://zhuanlan.zhihu.com/p/259314634
编辑丨极市平台
本文仅用于学术分享,如有侵权,请联系后台作删文处理。

极市导读

 

本文总结了FCOS无cost涨点的技巧,内容涉及对原始论文中六个要素的分析及后续改进方案,值得刚入门的同学思考。>>加入极市CV技术交流群,走在计算机视觉的最前沿


我个人的观点,FCOS 应该算入门检测最合适的文章。
一茬茬同学第一次读 Faster R-CNN 时估计大多数都没有搞明白 anchor 的作用,FCOS 是 anchor free 的方法,可以先绕过 anchor 的概念。Paper 中用的 FPN 结构示意图上画得也比较清楚,如果看 FPN 原文,还要涉及到 RPN 和 Fast R-CNN 的不同处理,知道 top-down 和 bottom-up 的思想应该足够了。
简单总结 FCOS 无 cost 涨点 trick,大部分参考了 mmdetection 的源码。源自我面试时候最喜欢问的问题:这篇 paper 有什么不足,后续有哪些改进。
1. centerness 分支的位置
原始论文:centerness 分支与 cls 分支共享前面几个卷积
改进 trick:centerness 分支挪到 reg 分支,参考
https://github.com/tianzhi0549/FCOS/issues/89#issuecomment-516877042
2. center sampling
原始论文:GT bbox 内的点,分类时均作为正样本(下图上面小图的所有黄色区域)。
改进 trick:只有 GT bbox 中心附近的 radius * stride 内的小 bbox(可以叫 center bbox)内的点,分类时才作为正样本(下图下面小图的黄色和绿色区域)。
3. bbox norm
原始论文:假设 FPN 某个 stride feature map 上某个点的回归预测值为 x,则对应的值 ,其中 s_i 为 stride。
改进 trick:假设 FPN 某个 stride feature map 上某个点的回归预测值为 x,则对应的值为 。加入 ReLU 可以保证结果非负。注意训练时需要将与 GT 边界的距离,除以 FPN 对应 feature map 的 stride 作为目标值。
4. bbox loss weight
原始论文:所有正样本点的 weight 平权。
改进 trick:将样本点对应的 centerness 作为权重,离 GT 中心越近,权重越大。
5. reg loss
原始论文:IoU loss。
改进 trick:GIoU,参考 https://giou.stanford.edu/GIoU.pdf
6. centerness 分支的 label
原始论文:利用 l,t,r,b 计算 centerness。
改进 trick:直接用 IoU,参考 GFL 中的Why is IoU-branch always superior than centerness-branch?(https://arxiv.org/pdf/2006.04388.pdf)
小目标的 centerness 值比较小,最终 cls 分数很容易被阈值卡掉,另外 GFL 中改进了 cls 和 reg loss。
打个广告,欢迎大家找我内推。https://zhuanlan.zhihu.com/p/260428511


推荐阅读



 ACCV 2020国际细粒度网络图像识别竞赛正式开赛!



添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

△长按添加极市小助手

△长按关注极市平台,获取最新CV干货

觉得有用麻烦给个在看啦~  
浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报