面向图像检索的视觉特征提取及语义标注

被引量 : 0次 | 上传用户:xujinjinjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前面向图像的搜索引擎主要有两种:一是基于文本信息的图像检索系统,根据图像信息通过人工进行文本描述,该方式是在早期图像量不大的时候提出的。现在面对浩如烟海的图片量,手工标注的方式,劳力耗费太大,并且具有较强的主观性,标注的人根据自己的认知进行判断,图片反馈的信息很大程度上跟人的心理活动有关,因此这种检索方式已经越来越不能满足现在的要求。二是基于图像视觉内容的图像检索系统。主要是通过提取稳定的图像视觉特征并形成描述子,构建以距离相似度为索引方式进行检索,返回按照底层特征相似度大小排序的图像。但是人们检索的思维习惯是在语义基础上,视觉底层相似的图像可能表达不同的语义信息,视觉特征不相同的图像的语义信息有可能是相同的。这就是通常意义上基于内容图像检索带来的“语义鸿沟”。本文就此展开研究,在机器学习的基础上,将图像底层视觉特征与高层语义建立映射关系,结合监督学习和非监督学习两种方式构建语义标注模型。选用Dense SIFT采样形成SIFT局部描述符,完成对图像的特征提取和描述。由于特征维数较大,对每个描述符进行降维,接下来对特征进一步表达,分别选用词袋(Bag of Word, BOW)、局部特征聚合描述符(Vector of Locally Aggregated Descriptors, VLAD)、Fisher向量(Fisher Vector, FV)。FV相对BOW具有较大的数据编码优势,用较少的视觉词典形成更加细致的中间表达。为了弥补特征描述子的不足,引入了空间金字塔的特征表示方法,丰富了图像特征空间信息,最后使用支持向量机标注图像语义。图像语义标注模型被建立,图像检索可通过语义特征实现。但语义空间内相似图像太多,有时仍不能满足用户的需求。因此在此基础上,本文在图像检索系统上加入图像底层视觉特征的直接索引作为辅助检索,能够按照用户视觉上相似度进行排序,进一步实现精确查找。该实现方法兼顾了由有监督学习的方式得到的图像语义特征和由无监督学习的方式得到的底层视觉特征两种方式的优点,不仅实现了更符合人思维习惯的图像检索方式,通过自然语言描述的视觉概念查找,而且极大的提高了图像检索系统的有效性和准确性。
其他文献
第一部分平山病患者不同体位脊髓形态的影像学测量与对比研究背景:“平山病”即青少年上肢远端良性肌萎缩症,最早于1959年由日本学者平山惠造报道,是一类具有自限性的良性下运
随着我国煤矿开采深度的加深,热害成为矿井必须面临的问题。热害不仅加大了煤矿开采的成本,同时也影响了煤矿的安全生产。热害产生的原因调查是热害治理的前提,而风温的预测
为进一步深化基础教育课程改革,提高课堂教学效率,笔者尝试着进行生物课堂教学改革。在“三主五步”课堂教学改革中,教师应聚焦细节,打造有效课堂,让学生积极主动地学习,最大限度地
全球范围内具有最高恶性程度并最常见的一类肿瘤就是肝细胞瘤,而且40%-50%的患者都是我国的,如今虽然外科技术越来越先进,也逐渐完善了外科治疗方法,提高了肝癌根治性切除术
<正>经过十几年的紧张学习,刻苦攻读,终于实现"龙门一跃",跨进大学的校门,同时身份也为之一变——大学生。作为大学生,尤其是大学新生,面对新的环境,必须及时调整心态,才能尽
期刊
随着能源短缺问题层出不穷,风能作为地球表面上一种广泛分布的比较好的绿色能源,受到人们的青睐。而风力发电技术是有效利用风能的方式之一,对于大功率尤其是MW级风电系统控
本文以巴赫金的对话思想为理论依据,提出跨文化对话性是EFL/ESL教学核心的观点,认为EFL/ESL课堂是LC1与LC2持续对话的场所,跨文化对话是有效英语教学或学习的源动力,而跨文化
本文对网络新词"X客"的成词问题进行分析,主要从三个角度:语言学、心理学和文化学。文章认为,"X客"的出现和广泛应用在一定程度上反映了人们生活的心理价值取向,体现出时代的
当今,网络飞速发展,网络的应用早已普及到各行各业。全世界每天都有几十亿人口在不同的时间内使用着网络。网络与我们的生活紧密相连,以至于人们对网络安全也越来越重视。网
目的:探讨上消化道大出血并发急性心肌梗死患者的观察护理效果。方法:择我院于2012年5月至2013年12月期间的因上消化道大出血并发急性心肌梗死而住院治疗的老年患者60例作为