论文部分内容阅读
图像分类技术是计算机视觉领域重要的研究内容。图像分类性能的优劣对医学图像研究、生物数据分析、军事交通研究有至关重要的意义。伴随着机器学习的热潮,图像分类技术得到了迅速发展并成为计算机视觉领域研究的热点。主题模型是机器学习领域新兴的算法,它的出现为图像分类研究开辟了新的天空。主题模型是一种概率生成模型,主要应用在对文本信息进行处理中。相对于其他分类算法,其优势在于对语义信息的挖掘上。Latent Dirichlet Allocation(LDA)模型是在Probabilistic Latent Semantic Analysis (PLSA)模型的基础上提出的一种广泛应用在文本信息分类的主题模型。该算法采用了词袋(bag of words)思想,视每篇文档为一个词频向量。一篇文档代表了一些主题所构成的概率分布,而每一个主题又代表了很多单词所构成的概率分布。LDA通过这种方式把文本信息转化为易于建模的数字信息并挖掘数据集潜在的语义信息。随着LDA模型的发展和改进,它已经成功地应用在图像分类、检索等领域。但是,LDA算法使用的词袋模型把图像看作无序的单词而忽略了图像的空间结构信息,图核是一种计算图结构之间相似性的模型。本文提取了图像的空间结构信息并结合了主题模型和图核模型,分别从语义信息和空间结构信息的角度对图像进行处理。通过对这两种模型进行研究我们发现其中还存在可改进之处。本文首先对LDA的词袋模型进行改进,提高其分类效果,同时提出了使用带权重的最小生成树图核进行图像分类,并对最小生成树图核进行了改进,最后结合了两个模型的优势并应用于图像分类中,主要工作如下:1)利用传统LDA模型进行图像分类研究。在对图像进行处理时,使用SIFT算法检测特征点形成词典、计算词频,并根据LDA思想进行分类。文中利用Gibbs采样对参数进行估计,通过训练出来的参数对新图像进行分类预测。其次文中对这种传统方法进行改进,加入图像的色彩信息,利用RGB SIFT算法检测特征点,形成了信息更为丰富的描述子。2)本文对图核模型进行研究,并应用在图像分类中。首先综合考虑了常用的几种核,根据其优劣性,提出使用最小生成树算法计算图像之间相似性。其次在计算图结构相似性时,对最小生成树核进行改进,考虑了图结构中节点的权重信息。在利用带权重的最小生成树图核进行分类时,我们首先利用RGB SIFT算法得到图像的视觉单词以及空间坐标信息,通过构建四叉树把图像表示为图结构的数据,根据图来生成最小生成树并计算图像之间的相似性。为了利用相似性矩阵对图像进行分类,我们使用训练集中的相似性矩阵及其所属的类别对支持向量机(Support Vector Machine)即SVM进行训练,得到相应的分类器。其中支持向量机的核函数使用了最小生成树核。通过对测试集数据的分类预测验证了改进模型的优越性。3)结合LDA模型和图核模型的优缺点,将两种方法进行结合,使用余弦相似性得到LDA模型中图像的相似矩阵,并与图核中的相似性矩阵以一定的权值进行结合,最后利用SVM对相似性矩阵进行处理,成功对图像进行分类。该课题充分考虑图像的色彩信息、语义信息、空间信息得到新的模型进行图像分类。文中通过实验表明了该模型分类的优越性,也证明了该方法的合理性,具有较强的应用价值。