论文部分内容阅读
随着21世纪互联网的飞速发展,网络上的海量数据已经与我们的生活变得密不可分。如何令用户可以在如此海量的数据中迅速搜索到自己感兴趣的图片变得十分重要,因此图像检索成为了目前人们生活中必不可少的技术之一。但是利用图像本身的特征进行检索有着明显的缺点,提取出的图像特征维度过高,占用的存储空间巨大,导致了检索过程的效率十分低下。于是研究人员提出了基于哈希方法的图像检索技术,并在越来越多的检索系统中开始使用,取得了显著的效果。利用哈希方法进行图像检索又分为传统的哈希学习方法和基于深度神经网络的哈希学习方法。在传统的哈希学习中,利用手工设计进行对图像特征的提取在保留图像语义信息方面存在着一定的限制,导致后期学习的效果不是很好,然而利用深度神经网络进行哈希学习的方法取得了比较良好的效果。但是目前大多数利用深度神经网络进行的哈希学习都是在有监督的条件下进行的,然而在现实世界中有标签的图片是相对有限的,而且对图片进行标注是一件十分耗费人力物力的事情,所以实现基于半监督哈希学习的图像检索技术变得尤为重要。针对这些问题,本文的工作主要如下:首先针对现实世界中图像缺少标签的问题,利用栈式自编码器实现基于半监督哈希学习的图像检索技术。利用栈式自编码器完全无监督地对图像高级特征的提取,然后通过取图像数据集中部分的图像标签进行有监督的校正训练,实现半监督的哈希学习过程。因为受限于自编码器网络的性能瓶颈,改用生成对抗网络对模型的半监督机制进行了改进。通过生成对抗网络进行虚假的图像相似对和非相似对提升整个哈希学习网络的性能。然后使用胶囊网络对图像进行图像的特征提取方面的改进,并与传统利用深度卷积网络进行图像特征提取进行对比。由于胶囊网络更加贴合人类大脑的思维方式,能够更好的提取伸进网络中内部知识表示的分层关系,所以比传统的利用卷积网络进行哈希学习的效果要更加出色。通过在MNIST数据集和CIFAR-10数据集上进行对比实验,研究新型网络在这两种数据集上的效果,验证整个网络的有效性。并且与经典的基于哈希方法的图像检索技术进行对比,实验表明本文实现的基于半监督哈希学习技术相比于目前的哈希方法在图像检索中可以实现更好的检索效果。