基于半监督哈希学习的图像检索技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hanfeizifly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着21世纪互联网的飞速发展,网络上的海量数据已经与我们的生活变得密不可分。如何令用户可以在如此海量的数据中迅速搜索到自己感兴趣的图片变得十分重要,因此图像检索成为了目前人们生活中必不可少的技术之一。但是利用图像本身的特征进行检索有着明显的缺点,提取出的图像特征维度过高,占用的存储空间巨大,导致了检索过程的效率十分低下。于是研究人员提出了基于哈希方法的图像检索技术,并在越来越多的检索系统中开始使用,取得了显著的效果。利用哈希方法进行图像检索又分为传统的哈希学习方法和基于深度神经网络的哈希学习方法。在传统的哈希学习中,利用手工设计进行对图像特征的提取在保留图像语义信息方面存在着一定的限制,导致后期学习的效果不是很好,然而利用深度神经网络进行哈希学习的方法取得了比较良好的效果。但是目前大多数利用深度神经网络进行的哈希学习都是在有监督的条件下进行的,然而在现实世界中有标签的图片是相对有限的,而且对图片进行标注是一件十分耗费人力物力的事情,所以实现基于半监督哈希学习的图像检索技术变得尤为重要。针对这些问题,本文的工作主要如下:首先针对现实世界中图像缺少标签的问题,利用栈式自编码器实现基于半监督哈希学习的图像检索技术。利用栈式自编码器完全无监督地对图像高级特征的提取,然后通过取图像数据集中部分的图像标签进行有监督的校正训练,实现半监督的哈希学习过程。因为受限于自编码器网络的性能瓶颈,改用生成对抗网络对模型的半监督机制进行了改进。通过生成对抗网络进行虚假的图像相似对和非相似对提升整个哈希学习网络的性能。然后使用胶囊网络对图像进行图像的特征提取方面的改进,并与传统利用深度卷积网络进行图像特征提取进行对比。由于胶囊网络更加贴合人类大脑的思维方式,能够更好的提取伸进网络中内部知识表示的分层关系,所以比传统的利用卷积网络进行哈希学习的效果要更加出色。通过在MNIST数据集和CIFAR-10数据集上进行对比实验,研究新型网络在这两种数据集上的效果,验证整个网络的有效性。并且与经典的基于哈希方法的图像检索技术进行对比,实验表明本文实现的基于半监督哈希学习技术相比于目前的哈希方法在图像检索中可以实现更好的检索效果。
其他文献
数学源于对现实世界的抽象,基于抽象结构,通过符号运算、形式推理、模型构建等,理解和表达现实世界中事物的本质、关系和规律。以学习数学公理、定理、法则、公式和性质等为
随着互联网技术的迅速发展,数据呈指数增长,这些数据大多以时间序列形式存在,所以面向时间序列数据的挖掘技术与方法受到了广泛的重视。由于时间序列数据存在海量性、高维性
刑事诉讼的工作之一就是惩罚犯罪,虽然刑事诉讼制度早就存在,并且在实践中广泛渗透到每个人的生活之中,但其与个人信息保护之间的关系并没有得到普遍的关注,学界也多以“个人
图元(Graphlet)是大图中连通的诱导子图,因其广泛的应用吸引着众多研究者的关注。图元的统计量,即图元的数目和比例可以揭示出大图的某些特征,是研究复杂网络的一个很好的切
视觉SLAM(Visual Simultaneous Localization and Mapping,VSLAM)是移动机器人领域的重要技术,使得移动机器人更具智能化。目前的视觉SLAM算法大多是基于静态环境实现的,如果
云盘作为当前网络资源传播的重要渠道之一,不可避免的成为著作权侵权的重灾区。云盘服务向用户提供的空间存储、资源分享、在线预览和秒传等功能服务方便了用户之间作品资源
随着通信技术的进步,用户和应用的数量呈指数级增长,导致了资源的稀缺和功耗的增加。基站上的数据流量也随着用户数量的增加而增加。为了降低5G中蜂窝用户的中断概率,设备到
物理学科是一门综合性极强的自然学科。高中物理学科知识结构体系全面,涵盖的知识点丰富,涉及的领域广泛,对学生的综合能力有着极高的要求。“学习物理难、学好物理更难”越
高烈度地震区地震液化对各种工程建设都有相当大的危害,用标准贯入试验判断饱和砂土地震液化,能为工程抗震设计提供重要依据。本文通过对标准贯入试验的理论研究,结合具体工
在导航、雷达等数字信号处理领域,需要大量正余弦和反正切函数计算,目前主要的手段是采用FPGA并行完成。硬件设计方案主要包括查表法、多项式逼近方法和坐标旋转数字计算方法