论文部分内容阅读
随着大数据、云计算等技术的发展,互联网与用户终端产生了体量大、结构复杂、处理难度高的多媒体数据资源,其中图像类数据以其较为有代表性的语义特征内容、数据内部相关性、广泛的应用场景、多样化的检索识别需求,成为多媒体数据检索与识别任务中较为有代表性的一类。在处理以图像为代表的多媒体信息检索问题时,常会因为数据维度过高而面临较高的时间与空间复杂度,此时使用线性查找匹配方式进行检索和识别工作会面临较大的困难。近似最邻近检索算法(Approximate Nearest Neighbor Search,ANNS)可以在不显著降低查找性能的前提下,大幅降低检索和识别处理的时间与空间复杂度。在众多ANNS类技术中,检索哈希算法以其高速、准确、稳定的优点,受到了较为广泛的关注。检索哈希算法利用哈希映射的碰撞概念,使相关数据具有相同或相近的哈希编码,通过对编码的检索实现快速准确的近似最邻近检索。利用检索哈希算法实现的基于内容的图像检索系统,具有较高的检索速度与准确度。利用相关反馈、深度学习等技术,可以进一步提升检索哈希算法在不同应用场景中的检索性能。本文围绕哈希算法在图像检索类问题中的应用,针对不同类型图像检索任务需求,提出了一系列图像检索与识别领域内哈希算法的应用、改进、拓展模式。本文的主要创新工作概括如下:1.针对分布式图像检索的特点,基于分布式图像检索系统中的检索哈希算法与分布式哈希表结构,设计了应用于分布式检索系统的多特征检索算法与相关反馈算法。算法运用了多基元纹理直方图与SURF算子两种特征对图像进行特征提取,利用多组局部敏感哈希函数对图像进行映射,将映射结果存入分布式哈希表结构以快速实现分布式场景下的最邻近检索。对不同特征检索得到的结果,利用基于相关反馈的结果筛选算法对检索结果进行过滤,获得更符合用户倾向的结果。在分布式图像检索系统环境中,本文设计的多特征相关反馈算法与已有算法相比,使分布式检索系统能够获得更好的准确率、召回率性能指标,且不会破坏分布式检索系统的负载均衡性能。2.针对现有全端到端深度哈希算法在损失函数中的设计问题,提出了协调正则化深度监督哈希算法DSHIR(Deep Supervised Hashing Network with Integrated Regularization)。协调正则化深度监督哈希算法的学习问题包含图像深度特征学习与哈希编码学习两个主要问题,DSHIR算法通过研究两个学习问题的共性与特性,优化了深度学习算法损失函数设计中相关性学习的子损失函数,首次提出了基于零分割的码值优化子损失函数,并讨论了二值约束子损失函数在系统中的实际功能,设计并实现了综合各子损失函数性能优势的损失函数。DSHIR算法设计提升了检索哈希算法的编码性能,同时得出若干有拓展性的结论。3.针对使用预载入参数的多标签图像深度哈希算法设计问题,提出 了多标签分布优化的 DSH-COS(Deep Supervised Hashing with label Co-Occurrence Similarity)算法。哈希编码为最邻近检索系统提供的容错性,在单标签和多标签环境下有一定的区别,DSH-COS算法分析这种区别的具体表现形式,针对多标签数据的标签分布信息对多标签图像的相关性进行建模,并将数据相关性计算模块独立于深度学习模块之外,设计并实现了学习效率高、相关性计算灵活、准确性高的多标签图像最邻近检索算法。在标准数据集上的验证实验结果说明,DSH-COS算法与同类算法相比具有更好的检索性能,图像相关性建模方法更优。4.针对大规模高维数据集乘积量化编码的最邻近检索问题,通过分析现有检索加速算法存在的算法逻辑缺陷,设计了基于多哈希表结果融合的 PQMT(Product Quantization based Multi Table retrieval)算法,通过分析现有算法在多表融合过程中的性能瓶颈,提出了高效稳定的多表融合策略,使检索算法在保证足够召回率的同时,更快完成大规模数据集内的检索任务。与现有乘积量化编码检索加速算法相比,PQMT算法在同召回率准线上能够实现较为明显的检索速度提升。