L-SNET:从区域定位到尺度不变的医学图像分割
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
在医学图像分割中,广泛采用粗到细模型和级联分割体系结构来解决大尺度变化的问题。然而,这些方法有两个主要的局限性:第一阶段分割成为性能瓶颈;由于缺乏整体可微性,使得两个阶段的训练过程不同步、不一致。本文提出了一种可微的两阶段网络结构来解决这些问题。在第一阶段,定位网络(L-Net)以检测的方式定位感兴趣区域(roi);第二阶段,用分割网络(S-Net)对重新校准的roi进行精细分割;L-Net和S-Net之间的RoI重新校准模块,消除不一致性。在公共数据集上的实验结果表明,作者的方法优于最先进的粗到细模型,且计算开销可以忽略不计。
本文提出了一种创新的两阶段网络结构——L-SNet,它利用L-Net解决第一个定位问题,利用S-Net进行精细分割。第一阶段L-Net预测并定位所有roi;在第二阶段,S-Net进行更精细的分割;RoI再校准模块重新校准RoI,连接两个阶段,使L-SNet完全可微。作者的主要工作可以总结为:
作者提出了一种创新的两阶段网络结构来解决大规模变化,其中第一阶段进行有效的RoI检测,而不是广泛采用的粗分割。
作者设计了一个可解释的RoI重校准模块来连接L-Net和S-Net之间的梯度传播,使L-SNet完全可微。
作者提出的L-SNet以较少的计算开销持续提高了从粗到细模型在胰腺- ct数据集上的性能。
概述作者提出的L-SNet。给定一个CT图像切片,L-Net对RoI进行定位,RoI再校准模块RR将定位的RoI重新校准到一个固定的尺度,用S-Net进行更精细的分割。后期处理是将精细分割的掩模恢复到其在输入图像上的原始形状和位置。作者灵活的架构对L-Net和S-Net的形式几乎没有限制,因为它们可以是任何CNN。
L-Net管道。特征映射F’通过编码器-解码器结构提取。两个分支分别对F’进行关键点预测和边界框回归。
广泛使用的粗细化方法与作者的L-SNet的主要区别是,在将roi发送到第二阶段进行精细分割之前。
本文在分析了以往医学图像分割研究成果的基础上,提出了一种新的医学图像分割结构——L-SNet。在L-SNet中,L-Net和SNet共同承担分割任务:L-Net为本地化而设计,S-Net为分割而设计。RR模块连接L-Net和S-Net,建立整体的可微性。实验表明,L-SNet中的每一个模块,包括L-Net、S-Net和RR模块,都提高了最终的DSC。最后,使用L-SNet中的所有模块,作者的性能始终优于从粗到细的方法。
论文链接:https://arxiv.org/pdf/2102.05971.pdf
每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。
- END -
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~