论文部分内容阅读
图像分割是计算机视觉领域的重要研究分支,随着人们对健康水平的愈加关注,医学影像分割成为了图像分割的热门研究方向。面对多样的医学成像技术,传统的专家人工诊断的方式耗费大量的人力物力但效果有限,开发出计算机辅助诊断系统帮助临床预防、诊断、分割潜在病灶显得尤为重要。传统的图像分割方法大多基于先验规则,例如形状、纹理、边界等,其应用在复杂的医学图像分割任务时得到的结果难以令人满意。随着深度学习的不断发展,诸多深度学习方法被提出用来执行医学图像分割任务。对比传统的分割方法,深度学习方法在应对医学图像目标模糊、尺度变化等问题时,取得了令人满意的效果。为了更好地解决医学图像语义分割面临的多尺度变化、噪声干扰、结果粗糙等问题,本文立足于经典的编解码网络结构,提出了可行的模型改进方案,取得了更好的分割性能和鲁棒性。本文主要工作归纳如下:1)为了解决医学图像分割面临的预测结果粗糙、特征表示能力差的问题,本文研究了一种结合编解码网络与注意力机制的分割结构。首先,引入U-Net网络结构,既利用编码器阶段下采样操作提取目标高级语义特征,又在解码器阶段通过上采样和跳跃连接恢复高分辨率分割细节。其次,引入了卷积块注意力模块,相应从通道与空间维度使用注意力机制,重点关注对分割结果贡献度大的通道和特征密集的空间区域,过滤掉分割背景和噪声干扰。最后,提出一种结合编解码网络和注意力机制的分割模型,从通道和空间维度优化中间特征图,获得更准确细致的分割结果。在四个医学图像数据集上的实验结果显示,本模型相较于基准模型U-Net及其衍生网络获得了更准确的分割效果,具有更强大的特征表示能力。2)为了解决医学图像分割面临的多尺度变换问题和空间信息不充分利用问题,本文提出了结合聚合连接和注意力机制的多尺度分割模型。首先,采用聚合连接策略,虽然编解码结构使用跳跃连接帮助恢复高分辨率细节,但编解码器对应阶段的图像可能存在语义鸿沟。聚合连接可以弥合语义鸿沟,融合不同尺度和深度的特征信息,利于恢复预测细节。其次,使用多通道卷积模块,将带有残差连接的串联卷积结构拓展为多通道并联结构,多通道间互为补充,提供不同空间信息,帮助模型在多目标或者多尺度情况下保持分割准确性。最后,在编解码结构中融合聚合连接、多通道模块和注意力机制,提出改进模型。在四个医学图像数据集上与多个前沿分割网络进行对比试验,实验结果表明应对多尺度变化和噪声干扰等问题,提出的分割模型具有更好的分割性能和稳定性。3)为了解决CNN模型有限感受野导致的固有局限性问题,克服CNN模型建立长距离依赖能力差的缺点,本文提出一种结合Transformer和CNN的编解码分割模型。首先,使用CNN-Transformer混合的编码器结构,既利用CNN提取语义特征和恢复高分辨率细节的能力,又利用Transformer自注意力机制方便建立长距离依赖的优势。其次,引入了卷积块注意力模块,从通道和空间两个维度优化中间特征映射。最后,提出结合Transformer和CNN的分割模型,模型遵循编解码结构设计,使用CNN-Transformer混合编码器,融合卷积块注意力模块帮助分割。在Synapse多器官分割数据集上做出的对比实验证明了提出模型的有效性,结合Transformer和CNN的编解码模型能够获得准确的医学图像分割结果。