论文部分内容阅读
精准放疗是目前医学与深度学习相结合的主流研究方向之一。为了实现肺结节快速、准确的分割,提高医生诊断效率,本文以LIDC-IDRI数据集与Deep Lesion数据集中的肺部CT图像为对象,研究了改进的卷积神经网络分割算法和适用于肺部CT图像处理的半监督学习策略。本文主要的研究内容与结论包括:(1)CT数据集的预处理。为满足卷积神经网络的训练需求,首先筛选了公开的LIDC-IDRI数据集以及Deep Lesion数据集中的所有肺部CT图像。随后,利用改进的超像素分割算法对图像中的肺实质进行提取,去除躯干、床架等冗余信息,降低接下来的计算量。最后,经过旋转、平移、缩放与翻转等数据增强方法,建立了适用于本文的肺部CT数据集。(2)基于多尺度的肺结节分割算法。针对目前肺结节漏诊率较高、分割边缘较为粗糙的问题,设计了全局特征提取分支,以对低层特征进行语义指导。同时,采用增大步长的密集卷积取代了原有最大池化操作,增强了对细节的保留;针对不同尺寸结节分割精度差异较大的问题,改进了最深一层的网络结构,加入三个并行的具有不同扩张率的空洞卷积,以提高网络的泛化能力;针对肺部CT图像中前景、背景像素数量不均衡的问题,改进了Dice损失函数,使网络更倾向于前景像素。经实验验证,增强对肺结节全局特征的提取并取代池化层能够提高网络的识别能力。与传统分割算法相比,本文方法更能取得精细的分割边缘,与其他改进的分割算法相比,本文方法能够在各类型结节上取得更好的泛化能力,平均灵敏度可达94.25%。(3)基于多视角的算法优化。本文采用3D卷积核代替原有的二维卷积核,针对全图逐像素的肺结节分割计算量大,耗时较长的问题,在分割前新增了检测分支以缩小感兴趣区域,优化网络结构;针对候选框宽高比与肺结节尺寸不匹配的问题,通过k均值算法进行聚类,并利用了优化的轮廓系数算法确定对应k值;针对传统CT图像以横断面为主要呈现方式,肺结节容易与血管等组织混淆的问题,在检测分支中融入了基于矢状面和冠状面的识别结果,以减少假阳性样本数量。最后,在交叉熵损失中融入调节因子和正则项,提高网络精度,避免过拟合的发生。经实验验证,所改进的网络灵敏度提升了1.56%,取得了94.37%的Dice得分,且速度明显提高。(4)半监督学习策略的优化。针对传统自步学习较复杂样本所得权重近似,算法倾向选择边缘规则且特征单一的结节的问题,对正则化项参数进行优化,最大差异化结节权重,以筛选有价值的较简单结节,降低最复杂结节被选择的可能性;针对仅采用单一策略未标注样本数据利用率低的问题,采用基于自步和主动学习融合的思想,提出了一种适用于肺结节分割网络的半监督学习策略,充分挖掘未标注结节数据。实验发现,在迭代的基础上,本文所提出的学习策略仅利用500张左右的初始带标注样本就能实现较高的网络精度。综上所述,本文基于多视角的卷积神经网络和半监督学习实现了快速、准确的肺结节分割,对于推动医学领域智能辅助诊断,减轻医生负担,实现肺部病变组织的“精准放疗”具有重要的理论和实践意义。