基于标签特定特征及相关性的多标签学习

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yaoyao2048
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,多标签学习算法在图像分类、文本分类、音乐检索、生物信息学、多媒体自动注释等多个领域中得到了成功的应用。多标签数据集中的每个样本都由若干个标签类别进行标注,多标签分类的目的是为了学习未知样本相关的标签集合。随着多标签数据形式越来越复杂,标签数量规模越来越庞大,多标签分类模型通常更加复杂,面临着更多的挑战。多标签分类算法面临的挑战包括以下三个方面:1)多标签数据各个类别的标签拥有着特有的特征,这些特征丰富了标签隐藏的信息,构建特定特征时挖掘样本关联关系有助于对应标签表达能力的提升;2)有效地探索并利用标签相关性对于提高分类的准确性有很大的贡献;3)由于标签数目众多,多标签分类中类别不平衡问题显得越发棘手。本文围绕这三个方面的挑战展开研究,提出了两种基于标签特定特征构建的多标签分类算法,主要研究内容如下:1.基于如何有效构建标签特定特征的问题,提出了基于聚类提升树的多标签学习算法。首先利用聚类特征树将原始特征空间中的数据内在关联保存在树形结构中,从而获取相似群体样本之间的共性,并添加样本的关联作为原始特征集合的扩展。随后提出随机子集用于学习各类别标签的若干分类提升树,通过计算提升树的残差值用于学习各标签的特定特征。在11个各领域数据集上应用于7个多标签分类算法的对比实验上显示:本文算法在各评估指标上表现良好,论证了其有效提升了多标签分类的性能。2.以标签特定特征算法(Label Specific Features,LIFT)为基础,进行相关性及不平衡性问题的研究,提出了基于相关性构建的LIFT改进算法。算法在构建标签特征之前,引入去噪自编码器学习原始特征空间中的鲁棒性特征,随后基于标签相关性对各标签的特定特征进行稀疏共享,并结合标签的关联关系对于不平衡标签利用过采样的方法对少数类样本进行样本扩充。在7个不平衡多标签数据集上进行的丰富实验证实了本文方法泛化性能更好,同时,在不平衡指标上相比于主流的特定特征领域算法有明显的提升,表明算法对于缓解类别不平衡问题也具备优势。
其他文献
随着物联网(Internet of Things,Io T)的快速发展,射频识别(Radio Frequency Iden-tification,RFID)技术作为物联网的关键技术受到越来越广泛的关注,成为科研工作者的研究热
多变量时间序列(MTS:multivariate time series)分类是根据已知MTS提取特征或者训练模型将未知的MTS标记上已知标签的过程,该工作是当前数据挖掘和模式识别领域最具挑战性的
图像分类是机器学习和模式识别领域中一个十分重要的研究热点,其目的是基于标签已知且完整的图像数据集训练一个分类器,并对新样本的标签进行预测和分类。传统的图像分类问题
由于混沌系统的同步在保密通信、人体生命科学、林草动力学等方面有着广泛的应用前景,因此混沌系统的同步控制受到了越来越多学者的关注和研究。大多数的文献将混沌系统的同
背景&目的结直肠癌是一种常见的全球多发的死亡率高的恶性肿瘤,结直肠癌患者死亡率高的主要原因是难以控制的复发和转移。该肿瘤的发病率呈逐年增加的趋势,其高致残率及致死率给政府带来沉重的医疗和经济负担,而生物学标志物的鉴定有望辅助预测高复发风险的人群,从而实现早期诊断和进一步治疗。新合成的蛋白质在粗面内质网中进行组装合成,进一步运输到高尔基体进行糖基化修饰。上皮组织黏蛋白主要分为分泌型黏蛋白和膜
柔体机器人是由柔性材料构成的一类新型仿生机器人,理论上具有无限的自由度,结构复杂,理论分析困难。本文结合了分析力学和弹性力学的方法研究了柔体机器人系统的基本理论及N
随着计算机技术的发展以及智能手机与电子阅读设备的逐渐普及,电子文档已成为人们主要获取信息的方式之一。大部分印刷体文档是以图片形式进行存储的。得益于光学字符识别技
土地资源是人类生存最基本的自然资源,为国家和社会经济发展提供了物质保障。我国土地资源丰富、类型多样,获取真实准确的地物信息是对其进行合理开发利用的关键,对于及时规
文本情感分类是自然语言研究领域中的重要课题,目前对于文本情感分类研究多是基于情感词典和机器学习方法的,但它们在完成情感分类任务时割裂了文本中各词语间的关系,忽略了
滇越铁路是一条历史悠久、饱经沧桑的百年铁路,其文化遗产具有重大的价值。目前,法国、越南以及云南三方正积极开展滇越铁路申遗相关准备工作,申遗是一个漫长的过程。与此同时,由于对滇越铁路沿线文化遗产的重视程度不够,各类损毁时有发生,因此数字化展示不失为一种对滇越铁路现状保护的可行手段。基于以上背景,本文检索和分析了相关文献资料,研究了 HTML5、JS、Ajax、web应用框架、对象关系映射、信息推荐等