论文部分内容阅读
属性学习作为语义学习的主要分支之一,是当前视觉领域的研究热点。属性学习,包括二值属性和相对属性,是依靠人为定义一些具有具体含义的属性名称,通过判断图像或者视频中是否存在相应的属性,从而更为精确地描述物体与场景。属性学习与众多语义学习方法相同,在智能监控、机器人视觉等方面,均具有重要的研究价值和应用背景。 目前针对属性学习已有大量的研究工作,然而这些研究均忽略了一个重要问题。在传统的属性学习算法中,由于同一图像或者视频包含多种属性,因此在为属性建模的过程中,将需要大量的属性标签信息。获取标签信息的工作不仅费时而且费力,无法满足实际应用中的需要。因此,我们希望利用主动学习策略,从大量的无标签数据中挖掘具有代表性的标签信息,从而建立具有普适性的属性模型,这样能够极大地减少获取标签信息时所产生的时间消耗和体力消耗。 针对上述问题,本文首先通过研究相对属性建模中RankSVM-with-Sim模型的性质,发现基于最小化模型版本空间(VersionSpaceReduction)的主动学习算法和基于最大化模型变化(ExpectedModelChange)的主动学习算法的局限性,如版本空间的平分界面无法确定及无标签样本的标签估计问题等。为了解决上述局限性,本文进一步提出基于样本多样化与模型梯度最大化的主动学习算法。该算法主要包含两步,首先利用模型梯度最大化策略,实现样本所包含信息量大小的判定,进而选取信息量较大的多个无标签样本;其次利用样本多样化策略,通过类内方差最小化使得待标注样本间的共有信息达到最小,进而实现批处理式主动学习。 本文算法在OSR、Pubfig、Shoes三个数据库上进行验证实验,并设置两类实验任务(属性排序和图像分类)。实验结果表明,在RankSVM-with-Sim模型训练过程中,该主动学习算法能够有效减少训练所需的样本标签信息,同时提高属性学习器的准确性和稳定性。