分割网络中的奇技淫巧

小白学视觉

共 1411字,需浏览 3分钟

 ·

2022-10-15 05:20

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文简单介绍了分割网络中常用的技巧

1,少不了的encoder+decoder结构:unet系列
目前基本所有的分割网络整体架构都是由两部分组成,encoder逐步降低feature map分辨率,提升特征表达能力,decoder逐步提高feature map分辨率,提升细节区分能力,其中具有代表性的网络为unet系列,如下图所示。

2,参数量不变,增大感受野:dilation(atrous) convolution

增大感受野有利于提高类别分类的准确度,dilation convolution如下图所示,不同的dilation rate,拥有不同的感受野。

在deeplab系列中,使用了aspp(Atrous Special Pooling Pyramid )模块,获得更丰富的特征。如下图所示。

3,增加上下文信息:pspnet
如果说aspp通过使用不同感受野的特征获得multi-scale的特征,那psp模块则是通过融合不同的stride的pooling获得的特征,获得更丰富的context信息,有利于不同尺度的目标的分割。如下图所示

4,注意力机制

本的attention的模块,一般是F(in)*sigmoid(pooling+fc),其中pooling是global pooling。通过增加global pooling,一是增加特征的上下文信息,而是通过sigmoid增强特征表达。如下图所示。

再复杂一些的attention模块,如下图CBAM所示,包含了chanel attention module和spatial attention module。但都是运用了基本的attention module。

关于attention相关的文章有很多,但是应用时,还要考虑到效率,慎用。

5,多
征与多尺度融合

这两个比较常见,就不多解释了,分别用一个网络结构做一个示例:

ICNet

ESPNet

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇



下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报