论文部分内容阅读
随着信息技术的发展,互联网上的图像数据迅速增长。如何从海量的图像数据中快速准确地检索出人们感兴趣的图像已成为一个亟待解决的问题。图像检索技术应运而生,并成为了计算机视觉领域的一个研究热点。本文在分析和总结现有图像检索技术的基础上,提出了更加有效的图像检索方案,设计并实现了能够满足用户多种实际需求的图像检索算法。当前图像搜索引擎通常针对整体图像来提取特征并建立索引以完成检索任务。然而,用户在很多情况下只会关注图像的一部分,即他们的兴趣目标。此时,从整体图像提取的特征一部分是有效的,另一部分则是无效的且会对检索过程带来消极影响。为此,我们提出基于兴趣目标的图像检索方案,并借助于现有的显著性检测、图像分割、特征提取等技术实现一款有效的图像检索算法。本文第一部分首先采用分层显著性(HS)检测算法分析用户的兴趣目标并应用基于显著性的图像分割(SC)算法将其分割,然后针对兴趣目标提取HSV颜色特征、SIFT局部特征和CNN语义特征,最后计算其与数据库图像的相似度并根据相似度排序返回检索结果。第二部分结合目前主流的CNN模型,提出了利用多CNN融合特征表达图像的内容,由此实现了一款具有更高性能指标的图像检索算法。具体来说,利用已训练的模型分别提取图像三种不同类型的CNN特征,在此基础上,计算查询图像与数据库图像加权平均相似度得分,并将相似度得分较高的图像作为检索结果返回给用户。在两个公开图像数据库上的实验结果表明,基于多CNN特征融合的图像检索算法的效果优于基于单CNN特征的检索算法以及现有的其他图像检索算法。在分析前两部分的基础上,本文第三部分更广义地定义了兴趣目标,图像的背景和显著性目标都可以看作用户的兴趣目标。在充分研究和分析用户在多种情形下检索图像的需求后,设计了一款导向式的图像检索方案,并实现了相应的算法。首先,针对图像中可能出现多个显著性目标的问题,提出了一种以迭代的方式调用SC算法,顺序地分割出图像多个显著性目标的策略。然后,以这种多显著性目标分割策略来理解和获取用户的兴趣目标。算法在执行实际检索之前,会依据图像中不同兴趣目标给用户提供多种检索情形的导向选择,引导用户进行有效的图像检索。仿真实验结果表明,导向式图像检索算法在性能指标上明显高于其他检索算法,并且在实际执行检索时,这种检索算法在很大程度上解决了用户多种不同的图像检索任务。