论文部分内容阅读
随着近年互联网的飞速发展各种形式的数据爆炸式的增长,如何高效检索这些数据已成为迫切需要解决的问题。其中基于内容的图像检索是对图像数据进行检索的有效方式,它避免了基于关键字检索中人为标注关键字的主观影响和人力花销,目前基于内容的图像检索研究热点主要集中在对内容特征的有效提取上,特征越能准确表达图像信息检索效果就越好,然而在实际检索中还要面临巨量的数据,在有限的时间里不可能穷尽检索所有的数据,本文从检索策略出发,将最优搜索理论应用到图像检索中来,以使图像检索在有限的检索时间里满足检索需求。最优搜索理论是由B. Koopman在20世纪40年代创立的,自二战以来最优搜索理论的应用范围已由最初的军事应用向各行业发展,如石油勘探、市场调查、搜寻失踪人员或物品等。近年来已在生物信息学、入侵检测、无线传感器网络方面得到应用。本文在基于多种特征的图像检索的基础上着重对改善检索效率进行了深入的研究。主要内容为:1.研究了图像检索的关键技术,包括基于颜色和形状的特征,如颜色直方图、边缘方向直方图、不变矩、轮廓描述子。利用支持向量机进行用户反馈并综合多种特征进行检索。在此基础上开发了一个图像检索原型系统。2.应用最优搜索理论建立了一个检索模型,该模型使得在检索时间有限的情况下,能够最优的选择一个数据子集进行检索,从而在检索时间不超出预先设定的值时以最大概率检索到满足相似度要求的图像。模型中讨论了图像的分类和最优搜索理论中初始概率的估计方法,首先建立起指数型正则探测函数,并对其在初始概率估计时可能产生的误差做了误差分析。然后针对最优搜索对正则探测函数条件要求过于严格的缺点,建立了非正则的探测函数,讨论了该函数的参数确定及求解。通过实验将最优策略和非最优策略进行了比较,验证了本文中的最优检索模型确实起到了良好效果。3.为了使得最优搜索能够应用于分布式环境,提出了一种更加一般化的最优搜索模型,对其中一种满足相应条件的检索方式做了考查,从理论上证明了该方式可以应用最优搜索,并进行了仿真实验。