论文部分内容阅读
哈希学习已经被广泛应用到大规模检索任务中。哈希学习的目标是通过学习哈希函数将数据从原始特征表示映射到尽量保相似性的二值哈希编码表示。由于二值哈希编码定义在二值空间,哈希学习模型的优化变得十分困难。因此,部分哈希学习方法在训练过程中采用直接丢弃二值约束的松弛策略。然而,直接丢弃二值约束将使得哈希学习模型偏离原始的目标。这类方法的检索精度通常因此受损。离散哈希学习方法在学习过程中不丢弃二值约束。因此,离散哈希学习方法通常能达到比采用直接丢弃二值约束策略的哈希学习方法更高的检索精度。本文从非深度单模态、深度单模态、非深度多模态和深度多模态四个应用场景对离散哈希学习进行系统地研究。本文取得的创新成果如下:·在非深度单模态场景中,图哈希学习方法是一类重要的非深度单模态哈希学习方法。然而,现有的离散图哈希学习方法无法利用全部图相似度信息进行训练,他们的检索精度也因此受损。同时,现有的离散图哈希学习方法的训练过程低效。为了利用全部图相似度信息,本文提出一种基于特征变换的可扩展图哈希学习方法(ScalableGraphHashingwithFeatureTransformation,简称SGH)。SGH设计了一种隐式计算全部图相似度信息的方法,可以在训练过程中利用全部图相似度信息。通过隐式计算图相似度信息,SGH能达到线性复杂度。SGH还设计了一种逐比特离散优化算法学习二值哈希编码。实验结果表明,与现有的离散图哈希学习方法相比,SGH方法可以达到更高的检索精度,同时,SGH方法的训练也更高效。·在深度单模态场景中,现有的深度单模态哈希学习方法存在两个问题。一方面,现有的深度单模态哈希学习方法无法使用监督信息同时直接监督二值哈希编码学习和深度特征学习。另一方面,现有的深度单模态哈希学习方法都基于对称哈希框架,训练过程低效。本文首先提出一种深度离散监督哈希学习方法(DeepDiscreteSupervisedHashing,简称DDSH)。DDSH方法是第一个使用标签对信息同时直接监督二值哈希编码学习和深度特征学习的深度单模态哈希学习方法。同时,DDSH能实现两个过程的相互反馈。为了解决深度单模态哈希学习方法训练过程低效的问题,本文还提出一种非对称深度监督哈希学习方法(AsymmetricDeepSupervisedHashing,简称ADSH)。ADSH使用非对称哈希建模,同时设计了一种高效的离散优化算法。实验表明,与现有的深度单模态哈希学习方法相比,DDSH方法能达到更高的检索精度。同时,与除DDSH方法外的对称深度单模态哈希学习方法相比,ADSH方法能在最短时间内达到更高的检索精度。与DDSH方法相比,ADSH方法的训练更加高效。·在非深度多模态场景中,现有基于标签对信息的非深度跨模态离散哈希学习方法的复杂度为训练集大小的平方。计算资源有限时,这些方法只能使用采样训练集进行训练。同时,由于复杂度太高,这些方法的训练过程低效。本文提出一种基于离散隐因子模型的跨模态哈希学习方法(DiscreteLatentFactorModelbasedCross-ModalHashing,简称DLFH)。DLFH设计了一种可以直接学习二值哈希编码的离散优化算法,并给出了该算法的收敛性证明。DLFH还设计了一种基于随机采样策略的离散优化算法以提高训练效率。实验表明,与现有的非深度跨模态哈希学习方法相比,DLFH方法能达到更高的检索精度。同时,与现有的跨模态离散哈希学习方法相比,DLFH方法的训练更加高效。·在深度多模态场景中,本文首次将深度特征学习技术引入到跨模态哈希学习中,提出一种深度跨模态哈希学习方法(DeepCross-ModalHashing,简称DCMH)。DCMH方法是第一个将二值哈希编码学习和深度特征学习融合到同一个端到端的框架中的跨模态哈希学习方法。本文还提出一种基于深度离散隐因子模型的跨模态哈希学习方法(DeepDiscreteLatentFactorModelforCross-ModalHashing,简称DDLFH)。DDLFH通过结合DLFH的二值哈希编码学习能力和深度学习的深度特征学习能力,可以在同一框架中同时完成二值哈希编码学习和深度特征学习。实验表明,与非深度跨模态哈希学习方法相比,DCMH方法能达到更高的检索精度。同时,与现有的非深度跨模态哈希学习方法和深度跨模态哈希学习方法相比,DDLFH方法能达到更高的检索精度。