图像分割Unet、Unet++和Unet3+

2024-07-16 14:20| 来源: 网络整理| 查看: 265

向AI转型的程序员都关注了这个号👇👇👇

前言

最近学习了Unet、Unet++和UNet3+模型，并且对这三者进行了一些研究，并将其作为组会上报告的内容，效果还是不错，因此趁自己还记得一些，写一个博客记录一下，方便后续复习，不得不说Unet模型还是很强大的，也难怪Unet模型现在很火，值得一学。

一、FCN全卷积网络模型

FCN网络模型全称为全卷积神经网络模型(Fully Convolution Network)，该模型是2015年由Jonathan Long等人在一篇论文《Fully Convolutional Networks for Semantic Segmentation》中提出的语义分割模型。该模型算得上是深度学习用于语义分割领域的开山之作，在后续的语义分割模型中都可以看到FCN模型的影子。其模型结构和CNN非常相像，因此该模型也算是卷积神经网络CNN的升级

FCN核心思想：

1、将CNN的全连接层换成了卷积层，这样FCN就适应任何尺寸的图片输入，也可以使得网络输出是一个热度图（heatmap），而非单个类别标签。

2、加入上采样操作(反卷积) ，将卷积得到的feature map上采样到原图大小，然后这样就可以做像素级别的分类，这样就可以将分割任务变成了分类问题。

3、采用跳跃连接，即在上采样过程中加入不同深度的feature map。这样既可以将下采样过程中丢失的细节数据补全，又保留了原始图像的空间信息，使得模型具备更高的精度与鲁棒性。这样就是为什么FCN网络模型有FCN32、FCN16、FCN8，如下图

二、Unet编码模型

FCN模型的提出成为了深度学习解决分割问题的奠基石。但Unet模型的提出可以说是将深度学习解决分割问题推上了一个新的高度。论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》中的Unet模型是与FCN同年2015年提出来的，但其还是晚于FCN。Unet模型可以算是医学图像分割领域的领头者，其也是通过下采样获取特征图，然后再上采样还原到原图，但Unet模型有很多独特的地方，正因这些特点才使得U-Net网络模型到现在还如此火热。

U-Net模型各方面看起来是很好，但是我学到这里的时候就心中有很多疑问疑问了：

U-Net模型一定要按论文中的模型一样下采样四次才叫U-Net模型吗？

下采样对于分割网络是不是必须执行的呢？

上采样必须要等到下采样结束才可以开始上采样吗？

这些疑惑终于在UNet++网络模型的提出者写的一篇博客中解开了。链接：https://zhuanlan.zhihu.com/p/44958351

Unet的不足之处就在于它仅有同层之间的连接，上下层存在信息代沟现象。

三、Unet++模型

U-net++模型顾名思义就是U-Net模型的升级版，它出自论文《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》，它既融合了Unet模型的结构思想，也解决了Unet模型存在的不足。作者当时就在想，既然Unet模型不一定要下采样四次才是最佳的，那下采样多少次才是做好呢？作者就进行了不同层模型对比实验(如下图)，实验表明最佳的模型结构因数据集的不同而不同。

既然模型的下采样次数不是一个确定的值，那我们在训练模型前都需要把这些不同层的模型训练测试对比一下吗？我想应该是不需要的，不然这样太麻烦了，我们可以把这些模型融合到一个模型中去，让网络自己去学习不同深度的模型，这样就得到Unet++模型的基本结构了。

好吧，这个模型又经过其他大佬修改提出了U-Net3+模型，Unet++存在的不足就是增加了模型的参数量，从模型结构就可以看出，它比Unet多了很多中间节点；其次就是它缺乏全尺度探索足够信息的能力，即低层模型结构没有加入深层特征图的内容。这也就是UNet3+的创新点。

四、Unet3+模型

Unet3+根据Unet++的不足一一进行了改进，它的创新点就是Unet++存在的不足。

4.1、改进的跳跃连接（全尺度跳跃连接）

无论是连接简单的UNet，还是连接紧密嵌套的UNet++，都缺乏从全尺度探索足够信息的能力，未能明确了解器官的位置和边界。而Unet3+就去掉了Unet++的稠密卷积块，而是提出了一种全尺寸跳跃连接。全尺寸跳跃连接改变了编码器和解码器之间的互连以及解码器子网之间的内连接，让每一个解码器层都融合了来自编码器中的小尺度和同尺度的特征图，以及来自解码器的大尺度的特征图，这些特征图捕获了全尺度下的细粒度语义和粗粒度语义。

例如，下图是X3De特征图的生成过程，它融合了编码器的小尺度特征图X1Ee、X2Ee、解码器的大尺度特征图X4DeX5De和同尺度的特征图X3Ee。但因为这些特征图与X3Ee的特征图尺寸和通道数不一致，因此小尺度的特征图需要经过下采样相应的倍数，大尺度的特征图需要上采样相应的倍数才可以和X3Ee的特征图进行融合，然后再经过320个3*3的卷积核进行卷积，最后经过BN+ReLU操作得到X3De的特征图，实现全尺度特征融合。

4.2 全尺度深度监督

Unet3+的全尺度深度监督与UNet++中的深度监督不同之处在于监督的位置不同，前者监督的是网络解码器每个阶段输出的特征图，后者监督的是网络第一层中的四张特征图（其中三张为跳跃连接中卷积块的输出特征图，一张为解码器最后输出的特征图）。此外，在UNet3+中，为了实现深度监督，每个解码器阶段的最后一层被送入一个普通的3×3卷积层，然后是一个双线性上采样和一个sigmoid函数（这里的上采样是为了放大到全分辨率）。

4.3 分类指导模块(Classification-guided Module，CGM)

该模块的提出是为了解决医学图像分割过程中非器官图像出现假阳性的现象(意思就是输入一张没有目标器官的图像，经过模型测试，结果显示存在目标器官的假象)。这个分类指导模块就是将模型的最深层经过dropout，卷积，sigmoid等一系列的操作之后得到一个是否有目标器官的概率，再通过Argmax函数的帮助下得到一个{0，1}的单个输出，进而指导每一个切分侧边的输出。

五、总结

从上面的学习我们可以知道Unet3+的性能是优于Unet和Unet++的，但是无论是Unet、Unet++还是Unet3+他们都是作者们经过多次实验得出的结论，都是值得我们学习的，他们都有各自的闪光点。Unet除了这两个变形之外还有很多很多其他的变形模型，他们一起被统称为UNet-Family。

UNet是一个经典的网络设计方式，在图像分割任务中具有大量的应用。也有许多新的方法在此基础上进行改进，融合更加新的网络设计理念，但目前几乎没有人对这些改进版本做过比较综合的比较。由于同一个网络结构可能在不同的数据集上表现出不一样的性能，在具体的任务场景中还是要结合数据集来选择合适的网络。

机器学习算法AI大数据技术搜索公众号添加： datanlp 长按图片，识别二维码阅读过本文的人还看了以下文章： TensorFlow 2.0深度学习案例实战基于40万表格数据集TableBank，用MaskRCNN做表格检测《基于深度学习的自然语言处理》中/英PDF Deep Learning 中文版初版-周志华团队【全套视频课】最全的目标检测算法系列讲解，通俗易懂！《美团机器学习实践》_美团算法团队.pdf 《深度学习入门：基于Python的理论与实现》高清中文PDF+源码《深度学习：基于Keras的Python实践》PDF和代码特征提取与图像处理(第二版).pdf python就业班学习视频，从入门到实战项目 2019最新《PyTorch自然语言处理》英、中文版PDF+源码《21个项目玩转深度学习：基于TensorFlow的实践详解》完整版PDF+附书代码《深度学习之pytorch》pdf+附书源码 PyTorch深度学习快速实战入门《pytorch-handbook》【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》《Python数据分析与挖掘实战》PDF+完整源码汽车行业完整知识图谱项目实战视频(全23课) 李沐大神开源《动手学深度学习》，加州伯克利深度学习（2019春）教材笔记、代码清晰易懂！李航《统计学习方法》最新资源全套！《神经网络与深度学习》最新2018版中英PDF+源码将机器学习模型部署为REST API FashionAI服装属性标签图像识别Top1-5方案分享重要开源！CNN-RNN-CTC 实现手写汉字识别 yolo3 检测出图像中的不规则汉字同样是机器学习算法工程师，你的面试为什么过不了？前海征信大数据算法：风险概率预测【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目，让你掌握深度学习图像分类 VGG16迁移学习，实现医学图像识别分类工程项目特征工程(一) 特征工程(二) :文本数据的展开、过滤和分块特征工程(三):特征缩放,从词袋到 TF-IDF 特征工程(四): 类别特征特征工程(五): PCA 降维特征工程(六): 非线性特征提取和模型堆叠特征工程(七)：图像特征提取和深度学习如何利用全新的决策树集成级联结构gcForest做特征工程并打分？ Machine Learning Yearning 中文翻译稿蚂蚁金服2018秋招-算法工程师（共四面）通过全球AI挑战-场景分类的比赛源码(多模型融合) 斯坦福CS230官方指南：CNN、RNN及使用技巧速查（打印收藏） python+flask搭建CNN在线识别手写中文网站中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程不断更新资源深度学习、机器学习、数据分析、python 搜索公众号添加： datayx

【本文地址】

公司简介

联系我们