论文部分内容阅读
随着科学技术的发展,医学图像越来越多地被用于医疗诊断中,医学图像数据的剧增,使得人们对于医学图像的检索需求越来越强烈。在这种背景下,人们相继提出了各种解决方案,大致可分为以下:(1)基于文本的医学图像检索对每张医学图像进行如关键字之类的标注,然后根据关键字对关键字对应的医学图像进行检索,返回符合关键字的图像。这种方式直观、符合人们的检索习惯,然而需要大量的人工对图像进行标注。(2)基于内容的医学图像检索通过提取检索图像与待检索图像的特征,对特征进行相似度比较,返回符合相似度要求的图像。这种方式中图像特征提取是很重要的环节,因为特征的好坏影响到最终检索效果。而目前大部分的特征提取方法是从图像的颜色、纹理、形状等的分析为基础,这就决定了特征提取方法的选择需要对图像内容做分析。选择一个合适的特征往往需要进行大量的尝试,设计一个合适的特征甚至需要数年。这使得人为选取特征提取方法不具通用性。在这种背景下,本文提出了融合SAE特征提取的医学图像检索方法,从而实现在序列MR图像中自动分离包含有指定目标物的图像。本文得到广东省高性能计算重点实验室开放项目资助(项目编号TH1528)。本文的工作内容如下:首先,分析了本课题的研究背景、目的和意义,并介绍了医学图像检索系统的国内外研究现状。其次,在分析医学图像检索的框架和图像可视化特征的基础上,阐述了主成份分析(PCA)的特征提取原理和算法,AE的特征提取原理和算法及SAE的构建过程,SVM分类器的算法,BP神经网络分类器的算法。第三,研究了融合SAE特征提取的医学图像检索的方法。提出了改进的SAE算法。在经典SAE的基础上,对输入加入随机掩蔽噪声,所以自动编码器在训练过程必须学习去除这种噪声而重构没有被噪声污染过的输入,因此,需要SAE去学习输入数据的更加鲁棒的表达。最后,将改进的SAE算法——堆叠去噪自动编码器用于融合SAE特征提取的医学图像检索模型,详细地阐述了模型的训练和构建步骤。第四,本文对融合SAE特征提取的医学图像检索方法进行了实验和分析。将本文的方法与PCA+SVM的组合方法用于MR医学图像库进行检索测试实验。实验结果显示,两种方法的识别时间分别为1.31s和21.56s,总的检索准确率分别为93.66%和89.53%。实验结果表明,融合SAE特征提取方法对于图像检索能够达到很好的效果。