对偶集多标记学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:qpalzm951
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习是机器学习领域的一个重要研究方向,其学习对象可同时与多个标记相关联。与单标记学习相比,多标记学习的输出空间呈指数级膨胀,导致学习任务变得异常困难,因而利用标记之间的相互关系成为提升多标记学习性能的关键。在许多实际多标记分类任务中,标记空间由两个存在对偶关系的标记集合构成。例如在书法作品分类任务中,需要同时预测作品的书法家和字体,每位书法家和每种字体均为一个类别标记,而所有书法家和所有字体构成了两个标记集合,其中一个样本在每个集合中有且仅有一个相关标记。传统多标记学习方法虽然能够处理这类问题,但是忽略了集合内部和集合之间非常明确的标记关系,难以取得最优性能。本文将这类问题命名为对偶集多标记学习,对其进行研究,主要取得了以下创新成果:第一,首次形式化定义了对偶集多标记学习这个新的学习框架,在该学习框架中,标记空间由两组标记集合构成,集合内部标记间存在互斥关系,而集合之间存在对偶关系。这种明确的标记关系使得每个学习样本在每个标记集合中有且仅有一个相关标记,有助于更有效地求解多标记学习任务。除此之外,本文提出了三种基本算法,并通过理论证明了在该类问题中基于对偶标记集合学习要比直接基于所有标记学习更有效。第二,针对对偶集多标记学习,提出了一种基于Boosting框架的高效算法DSML。它用基分类器刻画标记集合内部的互斥关系,又用模型重用机制和权重调整机制处理标记集合之间的对偶关系,使得两个标记集合可以互相帮助。实验结果表明该算法显著提升了对偶集多标记学习的分类准确率,针对两个机制的诊断实验也验证了它们的有效性。第三,基于提出的对偶集多标记学习框架,开发了一个书法图像分类系统。该系统在给定内存和存储空间的手机平台上,通过图像收集与训练样本标注、样本特征提取与分类器训练、图像预测等步骤同时预测目标书法图像的书法家标记和字体标记。
其他文献
新型城镇化是促进中国经济转型,实现现代化的必由之路,积极稳妥推进新型城镇化是扩大内需、实现强国富民的战略选择。新型城镇化是一项系统工程,建设资金需求巨大。2014年5月
车辆颜色是车辆的重要特征之一,为稽查黑车、追查套牌、打击逃费的重要手段,而车色往往易受外界环境影响。为此,论文依托省级交通运输科技项目,围绕车辆颜色视频识别算法展开
现实世界中的工程项目,科学问题研究以及日常生活中都存在各种各样的优化问题,而多目标优化问题(MOOP)则更广泛地应用于各个领域。旅行商问题和社团挖掘问题分别是多目标优化
残疾人是在生理、心理、人体结构上存在组织或功能损伤的弱势群体,普遍需要长期护理服务来重塑身体机能、辅助正常生活,从而重返社会活动、平等参与竞争,但是目前我国残疾人
随着我国城镇化进程和汽车工业飞速发展,越来越多的建筑垃圾和废旧轮胎亟需得到妥善处理,以免占用耕地、污染环境。建筑垃圾和废旧轮胎的资源化利用问题受到社会越来越广泛的
改革开放三十多年以来,我国经济取得了巨大的成功,伴随着经济增长奇迹的礼赞,产能过剩问题如影随形。目前,产能过剩对我国经济发展的负影响变得更为突出,产能过剩的特征也越
现在许多基于深度学习的人脸识别算法已经在现实生活中得到了广泛的应用,但是这些人脸识别的算法大多数需要待识别的人脸具有比较正面的姿态,如果人脸的姿态比较歪或者是整个
沥青混合料中集料的重量占据了沥青混合料总重量大约90%,决定了沥青混合料大部分的路用性能,其中集料的棱角特性对该混合料的物理特性影响最为显著,与沥青混合料的其他很多性
环境危机事件衍变的新问题不断挑战国家的传统治理秩序时,在新闻传播领域诞生了环境传播新兴领域,而具备该领域学科定位优势的“环境危机传播与管理”研究取向不仅是环境意义
单像素成像应用了压缩感知(Compressed Sensing,CS)理论,可以通过一个点探测器实现二维成像。单像素成像具高灵敏度的优势,因此被广泛应用于生物医学检测、航天遥感、三维成