论文部分内容阅读
基于内容的图像检索就是指在用户给定查询图像的条件下,根据图像的内容从大规模的图像库中搜索出与查询图像一致或相似的图像,但是图像低层视觉特征和高层语义之间的“语义鸿沟”是图像检索的一个关键问题,为了提高图像检索系统的性能,本文提出了一种结合D-S证据理论与多个支持向量机的新算法来增强图像标注和检索系统的性能。在图像标注和检索系统中,将基于全局的SVM和Co-SVM结合在一起,其中基于全局的SVM是在全局颜色和纹理特征上训练得到的,通过证据理论对SVM的输出进行修正,从而得到较好的分类结果;Co-SVM是根据不同低层视觉特征的统计特性,使用不同的核函数,分别在颜色和纹理特征空间上学习得到的,使用D-S证据理论对它们的分类结果进行融合得到最后的分类结果;最后采用D-S规则将多个SVM修正后的结果进行融合,根据融合的结果,可以得到未标记样本的确信度。同时我们也提出了一个新的主动反馈算法,将整个检索结果看成是候选标记集,用户可以根据自己的查询需要选择包含信息量较大的图像来标记,利用较多的正样本来减少标记的耗费,提高分类器的精度,从而也减少了反馈的次数,使得检索结果尽快达到终端用户需求的目的。给定一个输入图像,图像标注的目标是给图像指派一些可以反映图像视觉内容的关键字。我们利用当前比较成熟的图像检索技术,将图像标注看成是一个检索的问题。为了更好地获得图像的高层语义,我们借助于用户对图像的理解,采用两层反馈框架,第一层是使用D-S证据理论来修正和融合多类SVMs的概率输出,检索出与待标注图像相似的图像集,在检索与待标注图像相似的图像集时,为了提高图像检索的效率和精度,用户可以根据自己对图像视觉对象的理解,对检索的结果进行交互反馈;第二层反馈是利用图像检索所得到的相似图像集来获取图像的视觉信息,将经过证据理论修正过的确信度作为衡量视觉信息的权重,采用一定的、高效率的标记转移策略,将相似图像集中的部分关键字进行转移,从而得到待标注图像的标注关键字,此时用户可以根据自己对图像高层语义的理解来对关键字进行反馈,从而不断地修正图像的标注关键字,提高图像标注的精度。根据所提出的算法,我们开发了一个结合D-S证据理论与多SVMs的图像标注和检索系统,通过实验来验证我们所提出的方法的有效性;同时也设计了多组实验,与当前比较流行的方法进行比较,以此来显示我们的算法的有效性和高效性。