地标图像检索及街景图像位置识别技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:wml889900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展以及各种成像设备的普及,当前的互联网上累计了海量的地标和街景图像数据。给定查询图像,如何高效而精确地从这些大规模的图像集合中检索出内容相似的图像,成为了许多应用中的迫切需求。论文针对地标图像检索以及街景图像位置识别,围绕基于词包模型的地标图像检索方法中的爆发性问题、基于深度学习的地标图像检索和街景图像位置识别方法以及基于矩阵分解的相似度搜索方法开展研究。主要的研究工作如下:
  (1)提出分组爆发性匹配问题的处理方法。已有的爆发性问题处理方法关注于处理图像内和图像间一对多模式的爆发性匹配,忽略了由查询图像上相似的局部特征所导致的多对一模式的分组爆发性匹配。论文提出分组爆发性问题处理方法,其在查询图像上显式地检测爆发性特征的分组,然后利用分组信息来降低爆发性匹配所贡献的相似性权重。在地标图像检索和街景图像位置识别上的实验结果表明该方法能够有效地提升检索精度,并且相容于已有的爆发性处理方法。
  (2)提出后处理阶段的爆发性匹配处理方法。在地标图像检索中,经过空间校验之后的后处理阶段仍然存在着爆发性匹配问题,这些特征匹配大多是一对多或空间聚集模式的匹配。论文提出后处理阶段的爆发性匹配处理方法,利用局部特征的几何形状和视觉单词信息,删除不符合全局尺度变化的错误匹配以及一对多模式的冗余匹配,降低空间聚集匹配的贡献,从而提升最终的检索精度。在地标图像检索上的实验表明该方法能够适用于不同的检索模型并提升最终的检索精度。(3)提出融合全局与局部RMAC(Regional Maximum Activation of Convolutions)深度特征的地标图像检索方法。基于RMAC深度特征的地标图像检索方法中忽略了查询图像的全局信息,并且在目标定位阶段引入了定位误差。论文针对这一问题,提出融合全局和局部RMAC的地标图像检索方法,该方法首先使用查询图像的全局RMAC特征进行初始过滤,然后在目标定位之后将图像的全局和局部RMAC特征进行拼接作为图像的表示来进行重排序和查询展开。在地标图像检索上使用不同深度特征的实验结果表明该方法能够以较小的计算开销显著地提升检索精度。
  (4)提出基于NetVLAD(Network Vector of Local Aggregated Descriptor)深度特征的街景图像位置识别的后处理方法。街景图像位置识别问题中,基于NetVLAD深度特征检索出来的初始结果,在空间位置和图像内容上都有关联。为了进一步提升识别精度,论文提出基于位置融合的街景图像位置识别后处理方法,使用初始结果之间在空间位置和视觉内容上的互为近邻关系,对初始结果进行重排序。在街景图像位置识别上的实验结果表明该方法能够有效提升最终的识别精度。
  (5)提出基于局部约束线性编码的相似度搜索方法。基于全局特征的图像检索通常需要进行相似度搜索,而当前基于稀疏编码的相似度搜索方法需要较长的离线字典训练时间。针对这一问题,论文提出基于局部约束线性编码的相似度搜索方法,其直接使用k均值聚类学习字典,使用局部约束线性编码对数据进行表示,可以在降低字典训练时间的同时降低编码误差。在地标图像检索上的实验结果表明该方法能够在相同的计算和内存开销下,降低离线训练时间并提升最终的检索精度。
其他文献
高效的数据存储和实时分析处理是大数据时代的迫切需求,基于硬盘的传统存储系统由于巨大的访问延迟无法提供及时的响应,内存计算技术将工作数据存储在大容量内存中进行数据处理,减少甚至避免I/O请求,极大提高了大数据处理能力。但是由于“存储墙”和“功耗墙”问题,基于DRAM的内存系统依然难以满足大数据应用日益增长的大容量高性能低能耗存储需求。此外DRAM是易失的,数据的持久存储还需要依赖外存,无法完全避免高
学位
密文访问控制即由用户自行加密数据,通过对解密密钥分发范围的控制,来控制哪些用户有权访问数据。在密文访问控制系统中,用户可以不再依赖云服务提供商(Cloud Service Provider,CSP)来保护数据内容的安全,也能防止CSP非法的获取数据内容。目前的研究中,密文策略属性基加密(Ciphertext-Policy At-tribute Based Encryption,CP-ABE)被普遍
学位
近年来,数据量的激增迫切需要对可扩展机器学习关键技术的研究,而当前丰富的计算资源又为可扩展机器学习提供了机遇。为实现可扩展机器学习,本文从高效算法设计和并行与分布方法两条技术途径入手,对机器学习如何有效应对大数据挑战展开深入研究。基于算法与系统的协同设计,在保证精度的前提下,有效提高了机器学习的速度,增强了机器学习在计算和内存方面的扩展性,取得了以下几个方面的研究成果:  1.提出了两种数据和模型
学位
大规模分布式系统已成为云计算和现代应用的主要支柱,数十亿的终端用户实时依赖于这些系统的可信性。不幸的是,分布式系统中的性能缺陷常常引发严重的性能损失,继而导致糟糕的用户体验并带来严重的经济损失。然而,由于分布式系统中性能缺陷的复杂性和多样性,检测分布式系统的性能缺陷面临着大量挑战,特别是缺乏对分布式性能缺陷的全面且深入的认识、难以检测高复杂性的分布式性能缺陷,以及对涉及到复杂多线程的分布式性能缺陷
学位
大数据时代,数据量正以前所未有的速度增长,全球数据总量突破10ZB,单个数据中心数据量也达到了EB级。数据量快速增长对存储系统提出了更高的挑战,其中,如何有效地对大数据进行保护成为研究热点。作为数据保护最常用的手段,备份系统会成倍地增加数据量,带来严重的存储空间消耗。研究表明,数字世界中包含大量冗余数据,尤其是在备份系统中,冗余数据比例普遍高于80%。重复数据删除作为一种数据缩减技术,能有效地检测
学位
图像是人类获取信息的重要来源。随着带有高清摄像头的智能手机的普及和成像器件在城市安防、卫星遥感遥测等诸多领域的广泛使用,这些成像器件产生着数量巨大的图像数据。人们对收集到的上述图像数据进行分析与处理,获得关于真实世界重要信息。然而,数字图像在成像、传输、存储等各个环节都不可避免的受到各种降质影响而降低质量,如噪声、低分辨率、模糊等。图像的质量对于基于图像的分析与理解的准确性有着极大的影响。因此,图
学位
生物信息学是在20世纪80年代开始,由生命科学与数学、计算机科学等学科交叉形成的一门新兴学科。对RNA的研究始终是生物信息学中一个十分重要的研究方向,且其热门程度呈不断上升的趋势。越来越多的研究表明RNA不仅能作为遗传信息的载体,也具有各种重要功能。已经证实,RNA的功能与其结构有着紧密的关联。为了更好地探索RNA的功能,就要对其结构进行研究。由于RNA分子具有降解速度快、难以结晶的特点,采用常规
随着大数据处理技术及人工智能的发展,机器人的感知和处理能力不断提高。机器人被广泛应用于工业、农业和日常生活等各个领域。与单体机器人系统相比,机器人群体通过协同合作可以获得更好的性能。自主控制是实现机器人群体应用的关键,保持通信连通是机器人群体协同合作的基础。然而,大多数现有的自主控制方法以群体连通作为前提假设,适用性不足。因此,研究机器人群体连通性与自主控制问题具有重要意义。本文在分析机器人群体连
关键基础设施网络是现代社会繁荣与发展的基石,其安全运行对于社会的稳定、国家的安全具有重要意义。然而,关键基础设施网络的安全稳定运行面临诸多挑战:自然灾害频发,人为失误和恶意操作不可避免,通过网络损毁物理实体成为可能,以上诸多因素使得关键基础设施网络中部分组件的失效不可避免。同时,网络的融合带来了级联失效的风险,单个组件的失效可能导致整个网络的崩溃。鲁棒性,一般定义为失效或恶意攻击下的生存能力,是衡
近年来,Android设备的用户数量不断增长,已经成功攻击者的攻击热点。TrustGo公司的分析应用报告显示,Google Play上3.15%的应用有可能泄露用户隐私或者存在恶意行为。而我国用户无法直接从Google Play上下载应用,导致了大量的、管理混乱的第三方应用市场的存在,对于Android设备安全性造成了严重的威胁。合谋作为一种隐蔽的攻击方式并不被大众重视,而由于Android简便的
学位