论文部分内容阅读
随着数字图像数量的急剧增长,如何能高效、快速地从海量图像数据中检索出用户所需的信息是当前图像应用领域的一个重要问题。从目前研究现状来看,图像视觉内容的索引一般可以用低层视觉特征(或物理特征)描述;图像语义内容的索引用语义特征(一般可以用文字)来描述,除采取人机交互方式获取外,还有待今后克服“语义鸿沟”。由于基于视觉注意模型的图像检测技术对克服“语义鸿沟”有很好的效果,因此成为了这几年的研究热点。但是现有基于视觉注意模型的检测技术对图像特征的提取、描述、以及融合等都不太理想,使图像检索的效率和准确率过于低下。针对这一系列问题,为了更有效地克服语义鸿沟,本文重新构建了一个客观视觉注意模型,将基于注意力和基于对象的感兴趣区检测方法相结合,提出了一种自动提取图像感兴趣区的检测方法,这种方法一方面有效利用了视觉注意机制度量区域兴趣,另一方面可以获取具有实际物理意义的区域。在模型中,提出了三种视觉特征提取的新技术。(1)显著点特征提取,显著点特征由动态阈值法中的类间方差和类内方差来提取和确定;可有效地提取出图像中的细节特征,增强图像被检索到的鲁棒性。(2)标记符特征提取,根据分水岭分割的内外标记符特征,用进化规划方法对其进行处理,然后提取出标记符特征;标记符特征能进一步的把图像的局部区域表征出来,对提高图像检索的准确率有较好的表现。(3)区域特征提取,用进化规划方法分割图像对象,并作为候选区域,由注意焦点选择候选区域生成显著区,输出显著度最大的区域作为视觉注意的区域特征;结合进化规划的区域特征提取技术,更加符合人眼的视觉特性,能够更好地提高图像检索的效率和准确率。由于这三种特征提取技术都采用了高效率的算法,大大节约了图像的处理成本。最后,融合这三种特征,把其作为图像的标志特征,进行相似性度量。结果表明,这种方法不仅提高了图像检索效率和准确率,而且产生的检索结果也比较理想。