基于卷积神经网络的肺结节检测和诊断算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:stacy_sj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肺癌严重威胁着人类的生命安全,是目前世界上发病率和死亡率最高的一种癌症。肺癌的早期诊断和早期治疗是提高肺癌患者五年存活率的关键。肺结节是肺癌早期的主要表现形式,基于CT影像学的肺结节检测、分割以及良恶性分类是肺癌早期诊断的关键步骤和有效手段。研究基于卷积神经网络的肺结节诊断算法并开发相应的系统,可为肺癌的早期诊断提供理论依据和手段。
  肺结节的检测和诊断通常包含三个步骤,首先进行肺结节的检测、然后基于检测的结果进行肺结节的分割,最后根据结节的位置信息和掩码信息进行肺结节的良恶性分类。
  针对CT图像中肺结节大小和形态差异性大,容易出现误检和漏检的情况,设计了一种基于两阶段卷积神经网络(Two-Stage Convolutional Neural Network,TSCNN)的方法,实现可疑肺结节的检测和其中假阳性结节的去除。在第一阶段,设计了一种以残差密集结构为基础的UNet网络以用于可疑结节的检测。为了提高召回率同时又不引入过多的假阳性,提出了一种以分割目标为导向的采样策略,并且使用线下的困难样本挖掘的方法进行模型的训练。在训练好的模型上根据提出的双尺度预测方法对可疑的结节进行快速定位。在第二阶段,设计了三个不同的基于双重池化结构的3DCNN分类网络,分别是SeResNet、DenseNet和InceptionNet,将它们输出结果的平均值作为最终是否为结节的概率。为了缓解该分类任务中训练样本集的样本量较少且正负样本不平衡的问题,提出了一种基于随机掩码的数据扩充方法。所提出的结节检测方法在LUNA16数据集上进行了实验验证,实验结果表明,该方法的CPM(Competition Performance Metric)达到了92.5%。
  为了有效地分割出不同大小、不同灰度和不同形态的结节,提出了一种称为双分支残差网络(Dual-Branch Residual Network,DB-ResNet)的肺结节分割模型。该模型可以同时获取肺结节在不同断层和不同尺度的特征。针对肺结节灰度差异大的特点,提出了中心灰度池化的方法以获取灰度特征,并将其与使用中心池化提取的特征相拼接,构成新的肺结节特征。此外,还提出了一种基于结节边界点数目的加权采样策略,更多地对尺寸较小的和边界不规则的结节进行采样,以实现对这些难以分割的结节的强化训练。所提出的结节分割方法在公共数据集LIDC-IDRI上进行了实验验证,实验结果表明,该方法的骰子相似系数、平均表面距离、灵敏度和阳性预测值分别达到了82.74%、0.19mm、89.35%和79.64%的分割效果。
  针对肺结节的良恶性在临床上分类难的问题,提出了一种基于3DCNN的多模型多尺度的集成学习(Multi-Model Multi-Scale Ensemble Learning architecture based on 3D CNN,MMMSEL-3DCNN)方法,可根据结节的尺寸大小选择相应的多个模型进行良恶性分类。每个模型都是将结节掩码区域图像、结节ROI图像以及其对应的增强图像作为网络输入的三个通道送入网络进行训练,以提取结节的高级特征。此外,针对数据集中有标记的训练数据少的问题,提出了一种称为随机演变的数据扩充方法。该方法模拟了病变组织恶化和康复的自然变化过程,并根据图形图像学中的局部扭曲算法加以实现,有效地增加了有标记的肺结节的训练数据,进一步提高了肺结节良恶性分类模型的鲁棒性。通过在LIDC-IDRI数据集上的实验验证,实验结果表明,所提出的MMMSEL-3DCNN方法的正确率和AUC(Area Under Curve)分别达到了0.905和0.942。
  与目前性能最好的几种方法的对比实验表明,所提出的肺结节检测、分割和良恶性分类方法,能有效地提高肺结节诊断的准确率,降低误诊率和漏诊率,为肺癌的早期诊断提供了理论依据和有效手段。
其他文献
磁盘是数据存储最常用的设备之一,磁盘故障预测是保障数据可靠性的重要技术手段。磁盘故障预测方法一般可以分为两大类:设备级故障(即整盘故障)预测和扇区级故障(即局部磁盘故障)预测。学术界采用一些传统机器学习方法,例如支持向量机、逻辑斯特回归、决策树和随机森林等,预测磁盘故障并取得了一些成果。但是,这些研究仍然存在以下三个方面不足:(1)面对实际数据中心中单一型号数量较少(小样本)磁盘的故障预测问题,预
学位
固态盘(Solid State Drive)因具有高内部并行性、低随机访问延迟、低能耗以及小尺寸等优势,作为主流的存储设备被广泛用于个人电脑和数据中心。近年来,随着5G和大数据技术发展,对存储容量、性能和可靠性提出了更高需求。得益于半导体制程工艺技术、单元多比特技术以及三维堆叠技术的发展,闪存存储密度大幅提升。然而,存储密度的增长是以牺牲可靠性为代价,不可靠的存储介质会引起数据存储可靠性维护开销大
学位
键值存储是支撑数据中心和众多数据密集型应用的关键技术,广泛应用于网页检索、电子商务、云存储、社交网络等领域。大数据时代下,键值存储的发展始终围绕着三大需求,即更高的访问效率、更大的存储容量和稳定可预测的性能。在近些年发展的新型存储器件中,瓦记录磁盘显著提高了磁盘面密度,具有低成本、高存储容量的优势;非易失性内存则能够明显提升访问效率,兼具传统硬盘的持久性和接近DRAM的存取速率。因此,新型存储器件
为从大规模图中挖掘出有价值的信息和知识,分布式图计算系统首先通过图分割方法,将图中的顶点和边分配到各计算节点上;然后,执行特定的图处理流程,迭代计算图中的顶点数值,直至图算法收敛。因此,图分割方法和图处理流程在很大程度上决定了分布式图计算系统的整体性能。传统的分布式图计算系统通常基于同构计算集群,并采用静态的、通用的图分析模式。但随着图计算应用在广度和深度上的不断扩展,新型的分布式图计算系统需要能
在互联网时代,大规模近似最近邻检索方法在海量多媒体数据检索,人脸识别等领域具有广泛应用。如何快速、准确、高效地对大规模(十亿级别)多媒体数据进行近似最近邻检索成为当前检索技术方向研究的热点和难点。  目前主流的大规模近似最近邻检索方法主要采用基于量化方法的索引结构和压缩编码方法来提高检索准确率和速度,并利用图形处理器(GPU)强大的并行计算能力对检索方法进行加速。由于GPU的内存空间有限与不同于C
移动边缘计算(Mobile Edge Computing, MEC)将大量的计算和频谱资源转移到接近最终用户的地方,减少了服务时延。面向MEC的延迟敏感的人工智能(Artificial Intelligence, AI)应用,如情感识别,人脸识别等,通常受到能量消耗和计算资源的限制,不能满足QoS要求。计算卸载与迁移作为MEC关键技术之一,研究者们提出各种方案以解决MEC中的计算与通信问题。  然
图像分类与目标检测是计算机视觉领域中众多人工智能应用中的关键技术,是重要的研究方向。其中图像分类是判别图像的类别问题,目标检测是实现对图像中的多个目标的定位和分类,即图像分类是目标检测的基础。近些年,研究人员利用深度学习方法大大提高了图像分类与目标检测的性能,使用卷积神经网络进行特征学习已经成为图像处理的主要方法。但是,由于图像中场景变化,目标遮挡,目标模糊,分辨率过低等原因,使得图像分类与目标检
学位
随着云存储规模的不断增大,云存储系统面临数据丢失的风险也不断提升,因此云存储系统中数据可靠性问题是当前学术界和工业界关注的一大热点。为了解决该问题,云存储系统通常使用具有低存储成本的纠删码技术。区别于一般存储系统,云存储系统需要满足海量用户复杂多变的存储需求,以及提供7×24高可用的存储服务,而这给云存储系统中纠删码技术带来两大关键性科学问题,分别是纠删码的存储扩展性能较低与频繁变化的存储扩展需求
深度学习作为目前人工智能领域的前沿技术,在处理现实世界复杂问题时优势显著。与传统的人工神经网络相比,深度神经网络拥有更多的隐藏层及神经元,同时产生了大量不同种类的中间数据。这些数据对训练与推理任务的执行效果能够起到至关重要的作用,但与此同时,也在系统层面上带来庞大的计算体量、存储开销以及通信负载。目前深度学习系统优化领域存在不少问题,训练运行时效率较为低下,主要问题集中在两方面,其一是高性能加速硬
学位
组合优化主要研究最优匹配、划分与排序等问题的求解方法,从有限个离散状态中搜索最佳状态。交通、物流、医疗、电信、能源、零售、军事等众多领域中均存在大量组合优化问题。尽管各个行业的业务背景千差万别,经过数学建模,绝大多数组合优化问题均可抽象为混合整数规划问题,本质上属于同一类问题。为高效求解该类问题,众多启发式优化算法被相继提出,面向政府与企业的需求提供解决方案。  一方面,路径规划与人员排班作为极具