论文部分内容阅读
多标记学习是机器学习领域的一个重要研究方向,其学习对象可同时与多个标记相关联。与单标记学习相比,多标记学习的输出空间呈指数级膨胀,导致学习任务变得异常困难,因而利用标记之间的相互关系成为提升多标记学习性能的关键。在许多实际多标记分类任务中,标记空间由两个存在对偶关系的标记集合构成。例如在书法作品分类任务中,需要同时预测作品的书法家和字体,每位书法家和每种字体均为一个类别标记,而所有书法家和所有字体构成了两个标记集合,其中一个样本在每个集合中有且仅有一个相关标记。传统多标记学习方法虽然能够处理这类问题,但是忽略了集合内部和集合之间非常明确的标记关系,难以取得最优性能。本文将这类问题命名为对偶集多标记学习,对其进行研究,主要取得了以下创新成果:第一,首次形式化定义了对偶集多标记学习这个新的学习框架,在该学习框架中,标记空间由两组标记集合构成,集合内部标记间存在互斥关系,而集合之间存在对偶关系。这种明确的标记关系使得每个学习样本在每个标记集合中有且仅有一个相关标记,有助于更有效地求解多标记学习任务。除此之外,本文提出了三种基本算法,并通过理论证明了在该类问题中基于对偶标记集合学习要比直接基于所有标记学习更有效。第二,针对对偶集多标记学习,提出了一种基于Boosting框架的高效算法DSML。它用基分类器刻画标记集合内部的互斥关系,又用模型重用机制和权重调整机制处理标记集合之间的对偶关系,使得两个标记集合可以互相帮助。实验结果表明该算法显著提升了对偶集多标记学习的分类准确率,针对两个机制的诊断实验也验证了它们的有效性。第三,基于提出的对偶集多标记学习框架,开发了一个书法图像分类系统。该系统在给定内存和存储空间的手机平台上,通过图像收集与训练样本标注、样本特征提取与分类器训练、图像预测等步骤同时预测目标书法图像的书法家标记和字体标记。