论文部分内容阅读
随着互联网、数码相机(特别是具有拍照功能的智能手机)和图像编辑工具的快速发展和大规模普及,网络上的图片数量成爆炸式增长。如何在互联网上海量图像中找到用户所需要的图像或者跟图像绑定的其他信息,成为越来越重要和具有挑战性的问题。传统的图像检索大多使用基于文本检索的方法,而文字难以充分表达出图像中包含的丰富信息,而传统的基于内容的图像检索要么鲁棒性不够,检索效果不好,要么检索效率太差,都不能完全满足用户的需求。近十年来,一些优秀的局部特征(如SIFT)和词袋模型(bag-of-visual-words,BOW)的出现和发展,大大推动了基于内容的图像检索的发展。词袋模型特别适合大规模的近似重复图像检索。本文主要研究了基于词袋模型的海量图像检索技术,从SIFT特征、词袋模型和空间关系检查三个方面进行深入研究。在研究的基础上,本文设计并实现了一个海量近似重复图像检索原型系统。该系统在百万级的图像数据库上能够实现实时的图像检索,较为准确地返回图像数据库中与查询图像内容近似重复的图像。借鉴前人提出的一些空间关系检查算法,本文提出了一种新的空间关系检查方法,即强几何一致性(Strong Geometry Consistency, SGC)。该方法充分利用局部特征点的尺度、方向和位置信息对匹配的特征点对进行空间关系检查,快速而准确地滤除错误的匹配,在几个知名数据集上的实验表现优于当前一些主流的方法。本文还提出一种简单而有效的尺度加权(Scale Weighting,SW)方法.该方法根据局部特征点的尺度进行加权,能有效提高检索的效果。