论文部分内容阅读
随着互联网技术和存储技术的迅速发展,越来越多的异构媒体数据大量出现并被广大用户所使用。其中,图像数据作为一种最常见的多媒体数据得到了相关研究人员的关注,使得图像识别技术出现并快速发展,但是在图像识别技术中仍然存在大量挑战性问题影响着图像识别技术的进一步发展,如小样本问题、遮挡与噪声等问题。此外,跨媒体检索技术作为多媒体技术快速发展的产物,在大数据时代得到了广泛关注,然而跨媒体检索中一个基本问题——语义鸿沟当前仍未找到一种高效的解决方法。针对图像识别与跨媒体检索中存在的问题,本文分别提出两种对应方法,并在主要数据集上对所提方法的准确性和可靠性进行分析和验证。本文主要工作及其创新点如下所示:1.针对图像识别中的小样本训练问题,本文将协同表示应用于小样本训练中,并提出一种基于协同表示的两步小样本人脸识别算法(TSCR)。本方法利用未标注数据去重构标注数据,并获得其对应的协同表示系数。同时将协同系数最大值所对应的样本加入原始的标注数据集,直到一半的未标注数据集被分配到标注数据集,最后对剩余的未标注数据使用协同表示分类器进行分类。实验结果证明TSCR是十分高效的。2.针对图像识别中图像的局部判定性问题,本文充分考虑未标注数据与其近邻关系,提出了一种基于稀疏子空间的加权局部协同表示算法(WLCRC)。WLCRC首先学习一个强相关性字典,其次结合加权协同表示与线性回归算法实现对未标注数据的优化。因此WLCRC在标注数据的重构过程中,充分考虑了数据的局部近邻特性与标注数据的语义,并获得了较好的识别效果。3.针对跨媒体检索中的语义鸿沟问题,本文提出一种半监督的模态相关性跨媒体检索方法(SMDCR)。本方法充分利用标注数据的语义与未标注数据间的关联性,同时提出一种自适应学习投影矩阵的优化方法,从而大大提升了数据检索的准确性,并在多个流行数据集上得到了较好的检索效果。4.针对跨媒体检索中标注数据语义与未标注数据间的关系,本文提出一种半监督距离一致性跨媒体检索方法(SSDC)。本方法利用现有的标注数据集构造查询数据对应的虚拟未标注检索集,并利用标注数据与未标注数据间的距离关系,实现高效的跨媒体检索,并在多个数据集上获得了不错的检索效果。