论文部分内容阅读
图像分类与识别在计算机视觉有非常广泛的应用,这涉及到许多领域,比如说图像检索、图像分析、机器人定位等。特别是随着脑科学与认知科学研究的兴起,同时也伴随着成像手段的日益多样化,以磁共振图像为主的三维图像数据在图像分类识别特别是在医学图像的分类识别中占有越来越重要的地位和作用。然而由于人脑磁共振图像的高维特性,导致了人的可读性降低,因此,三维图像的分类识别仍是一个有挑战的问题。 本文针对人脑磁共振图像等三维图像数据,重点研究了三维特征提取算法以及基于三维特征提取算法的图像分类识别算法框架,并将提出的算法应用于三维医学图像的分类识别中。本文开展的主要工作以及取得的成果包括以下几个方面: (1)三维特征描述算法——3D-WHGO 本文针对三维图像本身具有时空维、信息量更大的特点,在加权梯度方向直方图(Weighted Histogram of Gradient Orientation,WHGO)特征描述算子的基础上,提出了一种新的三维特征描述算子——3D-WHGO。在构造三维特征描述算法中,首先定义了三维图像中的梯度大小以及梯度方向的计算方法,其次在三维空间中对梯度方向的频率信息,统计它的直方图,并使用梯度的大小,来对梯度方向直方图的进行加权处理。通过使用这样的方法,我们构造出来的三维特征描述算子,具备了空间中图像梯度频率的信息,同时也使得三维特征描述算子能够更充分地利用三维图像中特有的时空维信息,进而更有效的描述和表示三维图像特有的特征。 (2)提出了一种基于三维特征描述算法的图像分类识别框架——“多分辨率三维空间金字塔”算法 本文在三维特征提取算法的基础上,提出了“多分辨率三维空间金字塔”算法。该算法以三维特征提取描述算子为基础,在“空间金字塔匹配”算法的基础上,融合了三维图像特有的空间特性。通过对图像进行空间划分,更多的利用特征与特征之间的空间信息。同时将多分辨率的思想引入到了算法框架之中,在决策时采用多分辨率融合的方式形成最终的分类器,形成了“多分辨率三维空间金字塔”算法的整体框架。 (3)将三维图像分类识别框架应用于医学图像分析中 本文将提出的算法框架用于人脑磁共振图像的图像分类识别中。我们采用了三个数据中心的数据对算法的性能进行了测试,通过对数据中人脑磁共振图像的男女性别信息进行分类识别,并得到了理想的分类识别结果。不仅证明了我们提出的“多分辨率三维空间金字塔”算法对于三维图像分类识别的有效性,同时还证实了我们提出的三维特征提取算法——3D-WHGO特征描述子在分类性能以及计算时间上相比于目前的3D-SIFT描述子的优势。同时实验结果证实了在人脑结构磁共振图像的灰质中,是存在着性别个体差异的,而这些信息对于人类来说是不可辨识的。