论文部分内容阅读
随着互联网和现代电子设备的飞速发展,互联网中图像的数量已经达到了海量的规模,这使得基于内容的图像检索成为国内外的研究热点之一。传统的图像检索中存在着低层视觉特征和高层语义特征之间的语义鸿沟问题,如何能够有效的解决这种语义鸿沟已经成为了一个急需解决的难题。基于内容的图像检索是一门交叉学科,牵涉到图像处理、模式识别、机器学习等多个学科领域。针对上述问题,本文通过改进图像的特征提取方法,结合文本检索领域的单词模型来实现基于内容的图像检索,并通过相关反馈技术来解决语义鸿沟问题,主要工作包括以下几个方面:1.传统的SIFT(Scale Invariance Feature Transform,SIFT)特征维数较高,导致特征提取和匹配的复杂度很高。本文提出了自适应阈值的SIFT特征算法,根据图像内容设定阈值,检测出对噪音敏感的低对比度特征点,从而有效的控制SIFT特征的数量,达到降低运算复杂度的目的,提高图像特征提取和匹配的效率。2.单词模型是文本检索领域中应用广泛的一种模型,由于具有较好的检索效果,本文将该模型引入到图像检索中,提出了基于视觉单词模型的图像检索。首先对图像提取SIFT特征,使用AP(Affinity Propagation,AP)聚类算法对SIFT特征进行聚类,把聚类的中心作为视觉单词,这些视觉单词构成了检索系统的视觉单词词典。然后将图像的SIFT特征映射到该词典中,把图像表示为视觉单词直方图的形式。最后计算各直方图之间的相似度,实现图像相似度的计算。实验结果表明,基于AP聚类算法的视觉单词模型在图像检索中能够取得较好的检索效果,并且在不同类型的图像中表现出了很好的稳定性。3.针对图像检索中的语义鸿沟问题,本文提出了基于支持向量机(SupportVector Machine,SVM)的相关反馈技术。相关反馈通过用户对系统的反馈,把用户对结果的标记作为训练样本,通过机器学习的相关理论调整系统的检索参数,达到提高检索准确率的目的。本文对SVM理论进行了研究,将基于SVM的相关反馈技术应用到图像检索中。实验结果表明,通过用户的反馈,图像检索的准确率能够得到明显的提高,在一定程度上解决了图像检索中的语义鸿沟问题。