pytorch复现语义分割U²-Net,附预训练模型

机器学习AI算法工程

共 2074字,需浏览 5分钟

 ·

2020-10-01 21:35





向AI转型的程序员都关注了这个号???

机器学习AI算法工程   公众号:datayx



U²-Net在Reddit、Twitter火爆一时,号称2020年最强的静态背景分割算法,下图展示了U²-Net与其他方法的性能对比:



1. U²-Net的优势
  • 提出的ReSidual U-blocks (RSU)中混合了不同大小的感受场,能够从不同的尺度捕捉更多的上下文信息;
  • 在不显著增加计算代价的情况下,增加了整个体系结构的深度;
  • 从头开始训练深度网络,无需使用图像分类任务中的Backbone。
2. U²-Net的设计思想
  • U2-Net是一种为SOD设计的两级嵌套的U型结构网络;
  • 在底层设计了一种新的ReSidual U-blocks (RSU),它能够在不降低特征图分辨率的情况下提取多尺度特征;
  • 在顶层设计了一种类似U-Net的结构,其中每一级都由RSU块填充。




从这个结构大家应该可以看到,这有点Transformer的思想啊!通过堆叠更多的sequence2sequence (在这里是encodeer和decoder)来获取尽可能多的语义信息。

从网络结构里面我们能学习到一些比较有意思的思想:

  • 堆叠work的block来暴力获取更大的gain;

  • 使用大的空洞卷积因子来获取更大的感受野,整体的视觉信息更加丰富;

  • 通过不同level的输出来fuse最终的输出。

其实同样的idea也可以用在目标检测,实例分割等方面。。只是看你有没有足够的运气在有限的时间内找到一个work的方法。


代码及运行教程  获取:

关注微信公众号 datayx  然后回复  u2  即可获取。

AI项目体验地址 https://loveai.tech


u2net的应用

我们自始至终都倡导学以致用,即便是最fancy的模型,我们也会挖掘它的应用点。对于这个模型来说,毫无疑问,用来去除背景是最好的应用。

来在一些范例的图片上看看效果,:


应用于抠图




阅读过本文的人还看了以下文章:


TensorFlow 2.0深度学习案例实战


基于40万表格数据集TableBank,用MaskRCNN做表格检测


《基于深度学习的自然语言处理》中/英PDF


Deep Learning 中文版初版-周志华团队


【全套视频课】最全的目标检测算法系列讲解,通俗易懂!


《美团机器学习实践》_美团算法团队.pdf


《深度学习入门:基于Python的理论与实现》高清中文PDF+源码


特征提取与图像处理(第二版).pdf


python就业班学习视频,从入门到实战项目


2019最新《PyTorch自然语言处理》英、中文版PDF+源码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


PyTorch深度学习快速实战入门《pytorch-handbook》


【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》


《Python数据分析与挖掘实战》PDF+完整源码


汽车行业完整知识图谱项目实战视频(全23课)


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  



机大数据技术与机器学习工程

 搜索公众号添加: datanlp

长按图片,识别二维码



浏览 100
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报