论文部分内容阅读
随着移动互联网的飞速发展,电子商务早已经深深的改变了我们传统的生活方式。高性能智能终端又让随时随地的自拍成为可能,导致产生了海量的不同场景的图像。大量这些不同场景,背景复杂,非规则图片信息的检索和识别已经成为了一个重要的研究问题。图像标签作为图像的直观文字描述,能为图像处理提供额外信息,对图像处理具有重要的作用。而海量、复杂的跨场景图片如果单纯依靠人工进行标注具有很大困难,因此跨场景图像的自动标注技术研究就为这些图片的充分标注提供了可能,也为后续的图像处理应用提供了基础。图像自动标注问题是图像处理领域的重要问题之一,传统的方法提取图像的全局特征或局部特征,将图像映射到特征空间上,并通过机器学习的方法最终完成标注过程。这类方法并未考虑到图像中不同物体与标注之间的关系,也无法解决多场景图像背景差异性的问题。因此,本文提出了基于多示例学习的跨场景图像标注算法,扩展了传统自动标注的应用范围,主要完成了如下工作:首先,根据实际应用的需求,提出了通过跨场景图片标注的方法解决跨场景图像的识别问题。针对跨场景人体服装背景复杂、内容丰富的特点,提出了针对这类图像的特殊预处理与特征提取方法;其次,考虑到不同场景下,同一物体往往呈现不同表现形态,因此将多示例学习框架与图像自动标注相结合,并设计了相应的跨场景图像标注流程;最后,结合本文提出的图像标注流程,选择多示例学习方法作为图像标注的分类算法,并考虑图像语义的歧义性,将多示例学习扩展到多示例多类标学习。并对已有的多示例多类标支持向量机方法进行了改进,提出了一种新的包嵌入方法,并引入了半监督学习的思想,通过实验验证了算法的有效性。