基于显著视觉和文本特征提取的视觉和文本图像检索方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:biiq123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量数字设备的巨大发展为数字图像的获取和共享创造了无数机会。然而,过多的数字图像形成了庞大的组织管理不善的图像资料库。基于内容的图像检索(content based image retrieval,CBIR)被认为是一种索引和检索大规模图像数据库最合适的方法之一。CBIR系统的核心概念是在用户提供一个样本图像或其它语义线索(比如指定颜色、关键字或草图)的情况下帮助用户检索出一定数量的相似图像。现有的CBIR系统主要通过分析和提取图像内容(即颜色,形状,纹理)来检索视觉图像。然而,我们非常需要一个可以将文本内容(即出现在图像内的文本)作为视觉和文本图像检索依据的系统。本文重点研究了通过考虑图像的视觉和文本特征来检索视觉和文本图像的新方法。本文主要关注点如下。(1)本研究解决了基于可视文本的相似文本图像搜索与检索问题,提出一种从文本图像中检测文本的新方法,并将该文本作为关键词来索引和检索相似文本图像。首先,使用最大稳定极值区域(maximally stable extremal region,MSER)算法来检测文本区域。其次,使用基于几何约束和笔画宽度变换(stroke width transform,SWT)的两步滤波器来消除不想要的误报文本区域。剩余的文本区域进入下一步以进行光学字符识别。然后,使用神经概率语言模型形成关键字。最后,基于形成的关键字对相似文本图像进行检索。实验结果表明,文本特征的优势对于检索文本图像是有效的。(2)由于文本图像包含有效的目标和物体,它们可能有助于对图像进行感知和识别。因此,本文提出一种通过考虑视觉和文本特征来检索相似文本图像的方法。第一步为视觉特征提取,提取并定位视觉显著关键点。第二步为文本特征提取,检测并识别出现在图像内的文本。然后,为两种类型的特征指定两个特征向量,并使用核方法来融合这两个特征向量。基于融合的特征向量可以检索出排名靠前的相似文本图像。该方法允许用户通过提供图像查询,关键字或两者的组合以三种可能的模式搜索文本图像。实验结果表明,将文本特征与视觉特征相结合可以提供高效的检索结果。(3)搜索和检索文本图像虽然是一个很好的方案,但是并不是所有图像都包含文本特征,而可能只包含显著视觉对象。视觉(即颜色,形状,纹理)或文本(即出现在图像中的文本)这两种类型的内容都涉及感知图像的基本特征。考虑到这一点,本文提出一种决策CBIR方法,能够区分和检索视觉和文本图像。首先,该方法将查询的图像分为文本或非文本图像。如果查询的是文本图像,则图像中出现的文本将被识别并形成为文本词袋。否则,处理查询图像以提取构成视觉词袋的视觉显著特征。其次,将视觉和文本特征融合在一起,并基于融合特征向量对排名靠前的相似图像进行检索。该方法允许用户根据待查询图像、关键字和两者结合进行查询。实验结果表明,该方法提高了视觉和文本图像检索的效率和准确性。(4)本文提出一种搜索和检索不同类别视觉图像的新方法。为了提高传统搜索的效率和准确性,提出了一种将低级视觉特征与颜色信息相结合的新方法。首先,用特征描述符提取视觉显著关键点并量化为特征向量。其次,使用非线性颜色空间模型提取和分割图像的颜色分布。然后,计算视觉特征和颜色特征的特征向量的相似性。最后,基于合成向量检索排名靠前的相似图像。实验结果表明,与最先进的方法相比,本文提出的方法的效率和准确性都得到了提高。
其他文献
地球物理多功能探测系统V6是中国科学院地质与地球物理所 2 0 0 0年底从加拿大凤凰公司引进的新仪器 ,它具有频点多 (62频点系列) ,抗干扰能力强 ,发射功率大 ,A/D转换 1 6位
液压成型机模具锥角是影响成型的关键参数,为降低压缩过程中的摩擦力、减少消耗的压缩能、提高成型燃料的成型密度和成型品质,运用ANSYS参数化语言,对液压成型机模具锥角进行
政策对股票市场影响巨大,特别是在股票市场的高峰和低谷时期政策的影响是极其重要的,因为它可能改变股票价格原来的运行方向,从而使价格产生较大的波动。 本文采用EGARCH模型
<正> 山东淄博陶瓷史编写组在淄博市文化部门过去普查的基础上,于1976年对淄博地区部份古窑址进行了复查,并选择了重点窑址——磁村进行了试掘。参加这一工作的有山东省博物
房地产开发项目具有周期长、投入大等显著特征,是一种动态管理过程。在开发过程中,消费者偏好、宏观经济态势、银行利率等因素都将对项目开发风险造成难以预测的影响。目前,
本文将围绕乡村旅游如何实现农村剩余劳动力转移以及为农民收入实现增收展开进一步的讨论,从而让人们更好的了解乡村旅游发展的重大意义与现实价值,它有利于更好的解决一直困
用CO2激光烧结合成了负热膨胀材料Sc2(WO4)3和Sc2(MoO4)3.实验表明,激光合成负热膨胀材料Sc2(WO4)3和Sc2(MoO4)3属于快速合成技术,合成一个样品的时间仅需几秒到十几秒,具有
采用硫酸法从微晶纤维素中制得纤维素纳米晶,并结合简单沉淀法制得纳米氧化锌/纤维素纳米晶复合粒子.通过简单热轧工艺将复合粒子有机嵌入基纸和丝绸面料之间,制备出抗菌丝绸
新的历史时期,企业新闻宣传工作是增强企业核心凝聚力的重要阵地和主要方式,是优化企业管理机制的重要工具和有效途径,是对外塑造企业形象和对内鼓舞士气的重要平台和基本载