论文部分内容阅读
肺癌严重威胁着人类的生命安全,是目前世界上发病率和死亡率最高的一种癌症。肺癌的早期诊断和早期治疗是提高肺癌患者五年存活率的关键。肺结节是肺癌早期的主要表现形式,基于CT影像学的肺结节检测、分割以及良恶性分类是肺癌早期诊断的关键步骤和有效手段。研究基于卷积神经网络的肺结节诊断算法并开发相应的系统,可为肺癌的早期诊断提供理论依据和手段。
肺结节的检测和诊断通常包含三个步骤,首先进行肺结节的检测、然后基于检测的结果进行肺结节的分割,最后根据结节的位置信息和掩码信息进行肺结节的良恶性分类。
针对CT图像中肺结节大小和形态差异性大,容易出现误检和漏检的情况,设计了一种基于两阶段卷积神经网络(Two-Stage Convolutional Neural Network,TSCNN)的方法,实现可疑肺结节的检测和其中假阳性结节的去除。在第一阶段,设计了一种以残差密集结构为基础的UNet网络以用于可疑结节的检测。为了提高召回率同时又不引入过多的假阳性,提出了一种以分割目标为导向的采样策略,并且使用线下的困难样本挖掘的方法进行模型的训练。在训练好的模型上根据提出的双尺度预测方法对可疑的结节进行快速定位。在第二阶段,设计了三个不同的基于双重池化结构的3DCNN分类网络,分别是SeResNet、DenseNet和InceptionNet,将它们输出结果的平均值作为最终是否为结节的概率。为了缓解该分类任务中训练样本集的样本量较少且正负样本不平衡的问题,提出了一种基于随机掩码的数据扩充方法。所提出的结节检测方法在LUNA16数据集上进行了实验验证,实验结果表明,该方法的CPM(Competition Performance Metric)达到了92.5%。
为了有效地分割出不同大小、不同灰度和不同形态的结节,提出了一种称为双分支残差网络(Dual-Branch Residual Network,DB-ResNet)的肺结节分割模型。该模型可以同时获取肺结节在不同断层和不同尺度的特征。针对肺结节灰度差异大的特点,提出了中心灰度池化的方法以获取灰度特征,并将其与使用中心池化提取的特征相拼接,构成新的肺结节特征。此外,还提出了一种基于结节边界点数目的加权采样策略,更多地对尺寸较小的和边界不规则的结节进行采样,以实现对这些难以分割的结节的强化训练。所提出的结节分割方法在公共数据集LIDC-IDRI上进行了实验验证,实验结果表明,该方法的骰子相似系数、平均表面距离、灵敏度和阳性预测值分别达到了82.74%、0.19mm、89.35%和79.64%的分割效果。
针对肺结节的良恶性在临床上分类难的问题,提出了一种基于3DCNN的多模型多尺度的集成学习(Multi-Model Multi-Scale Ensemble Learning architecture based on 3D CNN,MMMSEL-3DCNN)方法,可根据结节的尺寸大小选择相应的多个模型进行良恶性分类。每个模型都是将结节掩码区域图像、结节ROI图像以及其对应的增强图像作为网络输入的三个通道送入网络进行训练,以提取结节的高级特征。此外,针对数据集中有标记的训练数据少的问题,提出了一种称为随机演变的数据扩充方法。该方法模拟了病变组织恶化和康复的自然变化过程,并根据图形图像学中的局部扭曲算法加以实现,有效地增加了有标记的肺结节的训练数据,进一步提高了肺结节良恶性分类模型的鲁棒性。通过在LIDC-IDRI数据集上的实验验证,实验结果表明,所提出的MMMSEL-3DCNN方法的正确率和AUC(Area Under Curve)分别达到了0.905和0.942。
与目前性能最好的几种方法的对比实验表明,所提出的肺结节检测、分割和良恶性分类方法,能有效地提高肺结节诊断的准确率,降低误诊率和漏诊率,为肺癌的早期诊断提供了理论依据和有效手段。
肺结节的检测和诊断通常包含三个步骤,首先进行肺结节的检测、然后基于检测的结果进行肺结节的分割,最后根据结节的位置信息和掩码信息进行肺结节的良恶性分类。
针对CT图像中肺结节大小和形态差异性大,容易出现误检和漏检的情况,设计了一种基于两阶段卷积神经网络(Two-Stage Convolutional Neural Network,TSCNN)的方法,实现可疑肺结节的检测和其中假阳性结节的去除。在第一阶段,设计了一种以残差密集结构为基础的UNet网络以用于可疑结节的检测。为了提高召回率同时又不引入过多的假阳性,提出了一种以分割目标为导向的采样策略,并且使用线下的困难样本挖掘的方法进行模型的训练。在训练好的模型上根据提出的双尺度预测方法对可疑的结节进行快速定位。在第二阶段,设计了三个不同的基于双重池化结构的3DCNN分类网络,分别是SeResNet、DenseNet和InceptionNet,将它们输出结果的平均值作为最终是否为结节的概率。为了缓解该分类任务中训练样本集的样本量较少且正负样本不平衡的问题,提出了一种基于随机掩码的数据扩充方法。所提出的结节检测方法在LUNA16数据集上进行了实验验证,实验结果表明,该方法的CPM(Competition Performance Metric)达到了92.5%。
为了有效地分割出不同大小、不同灰度和不同形态的结节,提出了一种称为双分支残差网络(Dual-Branch Residual Network,DB-ResNet)的肺结节分割模型。该模型可以同时获取肺结节在不同断层和不同尺度的特征。针对肺结节灰度差异大的特点,提出了中心灰度池化的方法以获取灰度特征,并将其与使用中心池化提取的特征相拼接,构成新的肺结节特征。此外,还提出了一种基于结节边界点数目的加权采样策略,更多地对尺寸较小的和边界不规则的结节进行采样,以实现对这些难以分割的结节的强化训练。所提出的结节分割方法在公共数据集LIDC-IDRI上进行了实验验证,实验结果表明,该方法的骰子相似系数、平均表面距离、灵敏度和阳性预测值分别达到了82.74%、0.19mm、89.35%和79.64%的分割效果。
针对肺结节的良恶性在临床上分类难的问题,提出了一种基于3DCNN的多模型多尺度的集成学习(Multi-Model Multi-Scale Ensemble Learning architecture based on 3D CNN,MMMSEL-3DCNN)方法,可根据结节的尺寸大小选择相应的多个模型进行良恶性分类。每个模型都是将结节掩码区域图像、结节ROI图像以及其对应的增强图像作为网络输入的三个通道送入网络进行训练,以提取结节的高级特征。此外,针对数据集中有标记的训练数据少的问题,提出了一种称为随机演变的数据扩充方法。该方法模拟了病变组织恶化和康复的自然变化过程,并根据图形图像学中的局部扭曲算法加以实现,有效地增加了有标记的肺结节的训练数据,进一步提高了肺结节良恶性分类模型的鲁棒性。通过在LIDC-IDRI数据集上的实验验证,实验结果表明,所提出的MMMSEL-3DCNN方法的正确率和AUC(Area Under Curve)分别达到了0.905和0.942。
与目前性能最好的几种方法的对比实验表明,所提出的肺结节检测、分割和良恶性分类方法,能有效地提高肺结节诊断的准确率,降低误诊率和漏诊率,为肺癌的早期诊断提供了理论依据和有效手段。