时隔一年!深度学习语义分割理论与代码实践指南.pdf第二版来了!
机器学习实验室
共 772字,需浏览 2分钟
·
2021-08-20 13:26
深度学习语义分割理论与代码实践指南更新了!时隔一年,笔者在第一版的基础上添加了最新的视觉Transformer部分模型应用的解读,工程部分对两种常见的深度学习模型部署方式进行了详细的介绍。
图像分类、目标检测和图像分割是基于深度学习的计算机视觉三大核心任务。三大任务之间明显存在着一种递进的层级关系,图像分类聚焦于整张图像,目标检测定位于图像具体区域,而图像分割则是细化到每一个像素。
基于深度学习的图像分割具体包括语义分割、实例分割和全景分割。语义分割的目的是要给每个像素赋予一个语义标签。语义分割在自动驾驶、场景解析、卫星遥感图像和医学影像等领域都有着广泛的应用前景。
本文作为基于PyTorch的语义分割技术手册,对语义分割的基本技术框架、主要网络模型和技术方法提供一个实战性指导和参考。
手册主要包括五个章节,其中第一章对语义分割做了一个简单概述,第二章详述了深度学习语义分割的关键技术组建,第三章提供数据导入的规范化的代码模板,第四章则是对经典的、常用的语义分割网络进行了详述。最后第五章探讨了PyTorch深度学习训练代码搭建范式、训练过程中的可视化展现方法以及模型部署方式。完整目录如下:
由于个人经验、能力有限,本手册作为2.0版本,仍然有诸多不完善和有失偏颇之处。所以该手册同时也是一个意见征求稿。
手册项目GitHub项目地址:
https://github.com/luwill/Semantic-Segmentation-Guide/
手册也提供了pdf版本,有需要的朋友可以点击下方获取。
评论