论文部分内容阅读
乳腺癌作为世界上最为常见的癌症之一,不仅死亡率高,而且治愈率极低,如今已经成为影响女性健康的头号杀手。在医疗领域,乳腺癌的诊疗主要依靠早发现、早治疗,越早诊疗,患者的临床治疗效果越好。因此,准确识别病灶对于治疗乳腺癌是非常重要的。本文结合机器学习算法,在乳腺肿块穿刺活检量化的病理型数据以及乳腺肿瘤超声图像数据上进行相关研究,针对病人所处疾病的不同阶段,选择不同的辅助诊断模型。本文主要研究内容如下:1.针对数值型数据,采用均衡化、归一化方法进行预处理。通过smote加权过采样方法,解决数据不均衡问题。为不同样本分配不同权值,根据不同权值生成不同数量的数据,使数据集达到平衡,并使用Pearson相关性分析对处理后的数据进行特征选择。针对超声图像数据,采用图像去噪、图像增强等预处理方法。通过小波算法处理数据存在噪声的问题,通过设置阈值去除噪声,保留可用信息,并使用几何平移的方法对数据进行增强处理,以强化图像中的有用信息。2.为提升乳腺癌辅助诊断识别的准确率,解决随机森林无法优化自身参数、容易陷于局部最优的问题,本文采用优化人工鱼群算法对随机森林的参数进行迭代优化。通过执行人工鱼聚类、追尾等四类行为,更新人工鱼的位置进行参数优化,使模型跳出局部最优。结合乳腺肿块图像量化得到的数值型数据集对模型进行验证,该模型的准确度达到97.5%,证明模型具有更好的分类效果。3.为提高辅助诊断模型对医学图像的分割精度,本文采用了BU-Net模型。通过在U-Net网络中增加批归一化层,并将模型中的普通卷积替换为深度可分离卷积的方法,解决分割准确性不高的问题。同时,借鉴迁移学习方法,利用开源大数据集预训练网络参数,解决超声图像数据不足的问题。结合BUSI乳腺超声图像数据集对该模型进行验证,证明改进的算法具有较高的分割准确率。