论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNN)模型具有非常出色的学习能力,它将图像数据直接输入,在无需人工对图像进行预处理和额外的特征抽取等复杂操作的同时以其特有的细粒度特征提取方式可以对图像进行细致的处理,与传统的机器学习算法相比,CNN在图像分类、图像分割和目标检测等研究领域取得了很好的成绩。近年来,CNN因其可以从医学图像中自动学习提取隐含的疾病诊断特征,使许多研究者将它应用于医学图像分析研究。乳腺癌组织病理图像本身比较复杂,具有广泛的异质性,当前使用的有关图像自动分类的方法对高分辨率图像处理具有局限性的不足使得最终的分类效果不理想,因此对细胞形态特征的准确评估仍然是一大难题。针对以上问题,本文设计了两种基于卷积神经网络的乳腺癌病理图像分类模型,主要研究内容如下:(1)为了使网络性能更加完美以及提高模型的特征提取能力,当前CNN向层数更深的方向发展,然而这一过程会导致参数数量增加、模型训练过程更加复杂,容易出现过拟合的风险。针对这一问题,本文设计了一种新的小型压缩-激励-残差(the Small Squeeze-and-Excitation Residual Networks,SSER)模块,与现有的压缩-激励-残差模型相比,SSER模块模型在参数更少的情况下可以获得具有竞争力的分类性能。在Cifar自然图像数据集上实验发现与瓶颈SE-ResNet模块和基本SE-ResNet模块相比,SSER模块在参数数量分别降低了29.4%和33.3%的情况下,也可以获得相近的分类结果;(2)CNN在训练的过程中,通常需要人工手动不断的去调整参数,针对这一问题本文设计了一种新的名为高斯误差调度器(the Gaussian Error Scheduler,ERF)的学习率调度器,相较于其他的学习率调度器,高斯误差调度器在网络训练的过程中相对简单且训练出来的网络模型分类性能也比较好;(3)本文针对乳腺癌病理图像,设计了两个模型。第一个模型结合SSER模块,设计了一个由SSER模块、池化层和全连接层构成的名为乳腺癌组织病理图像分类(the breast cancer histopathology image classification networks,BHCNet)的新型卷积神经网络,与未改进的现有网络比较,BHCNet在使用参数更少、分类准确率较高的情况下,可以有效避免手动特征提取的复杂性和局限性。本文将BHCNet用于乳腺癌组织病理图像的自动分类任务中,二分类准确率约为98.87%到99.34%,八分类准确率约为90.66%到93.81%。针对医学图像样本数目少的问题,本文进一步将BHCNet应用于乳腺癌组织病理图像小规模数据集上,通过实验发现其性能一般,因此引入迁移学习方法,设计了基于迁移学习的卷积神经网络模型,利用已经在大数据集上进行充分训练的预训练模型对乳腺癌病理图像小数据集进行分类,其中在二分类(无癌、有癌)获得了91.67%准确率,四分类获得了86.11%准确率。