论文部分内容阅读
随着数码相机和监控摄像头的普及,图像和视频已经逐渐成为继文字和语音之后新的信息记录方式。对于这些信息的处理,人们通常会采用人工方式对图像和视频进行筛选和分类,以便于后续的查找和使用。但随着信息增长速度日益加快,人工标注已很难满足人们的需求。因此,需要计算机模拟或辅助人工进行图像内容标注和排序,来帮助图像索引和查找。本文关注的用户感知支持的图像排序,正是通过计算机来模拟与人类感知相符的图像排序过程,通过对图像进行描述和索引,方便用户从海量数据中查找所需要的图像。本文从传统的图像排序框架出发,着重研究了收集标注排序列表,提取图像特征和学习排序函数三个模块,分析问题中的困难以及已有方法的缺陷,提出了新的解决办法。本文的主要研究工作包括:1.提出一种适应性的排序列表及相应的收集方法。这种排序列表能够适应不同用户的排序需求。而层次分类的方法则通过不断的让用户将未排序图片分为排在前和排在后两类,将一组图片按照用户排序组织成树形结构。这种方法在得到精细的排序信息的同时又避免了信息冗余,稳定性高,收集耗时短,非常适合中型规模的精细排序问题。2.提出层次排序支持向量机来学习用户标注的适应性排序列表。这种排序方法不仅能预测图片的排序,而且能够反映用户排序敏感度。在对新目标的一组图片进行排序时,引入关联预测,将待排序目标关联到已标注的目标上,并用关联目标的排序函数来预测新目标的排序。3.使用多种半监督方法对图像空间降维,在此基础上提取图像特征,使得到的图像特征包含语义信息,比低层特征更符合用户感知上的图像描述。4.针对低层视觉特征空间中,图像之间的距离并不能反映人类感知中它们之间的相似程度这个问题,直接从用户标注的图像相似度中学习嵌入,使得到的嵌入与人类感知的相似度相符。通过迭代的采样——标注——学习过程,在保证得到的嵌入和人类感知相似度相符的情况下,大大降低了所需的用户标注。