非线性规划形式的多标签特征选择算法的研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:liongliong425
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标签问题中,一个实例不仅与多个标签有关,而且常包含高维特征。在这些特征中有些是冗余的甚至是不相关的,它们的存在降低分类器性能,增加内存占用量。多标签特征选择技术由于能够挑选出与标签最相关的原始特征而成为最主流的解决上述问题的方法。本文在基于条件互信息的非线性规划形式特征子集选择框架QIPcmi的基础上提出两个多标签特征选择算法:(1)基于条件互信息联合遗传算法的多标签特征选择算法;(2)基于归一化条件互协方差算子的二次规划多标签特征选择算法。对于基于条件互信息联合遗传算法的多标签特征选择算法:我们首先对特征进行离散化处理,以满足条件互信息与互信息的要求。然后我们使用了带控制策略的遗传算法求解QIPcmi。在实验中,我们将提出的算法与四种现存的多标签特征选择算法在六个基准多标签数据集上进行比较。通过实验可以发现,我们提出的基于条件互信息联合遗传算法的多标签特征选择算法可以选出更优的特征子集。对于基于归一化条件互协方差算子的二次规划多标签特征选择算法:我们首先介绍了归一化条件互协方差算子和归一化互协方差算子,它们可以分别进行条件依赖性度量和依赖性度量。本文中,我们用它们分别替换QIPcmi中的条件互信息和互信息,形成基于归一化条件互协方差算子的非线性规划形式的特征子集选择方法。然后我们放松约束条件,将原本属于NP难度的问题转化成二次规划问题进行求解。在实验中,我们将该算法与本文提出的第一种算法以及其它两种已有算法在五个基准多标签数据集上进行比较。实验分析显示,我们提出的基于归一化条件互协方差算子的二次规划多标签特征选择算法在实验中拥有更好的分类效果。
其他文献
甲基苯丙胺是一种被广泛滥用的中枢兴奋剂,长期滥用会导致一系列神经退行性疾病,如帕金森疾病,亨廷顿氏病等。甲基苯丙胺的长期应用会导致神经毒性,进而引起多巴胺能神经元的
在军事工业、航空航天、动力机械等工程领域中,常常会遇到由于高速碰撞、瞬态加载所导致的冲击动力学问题。数值模拟是分析冲击动力学问题的重要手段,国内常用ANSYS/LS-DYNA
背景:心脑血管事件是血液透析患者最主要死亡原因,矿物质代谢异常是血液透析患者常见并发症。矿物质代谢异常促进了血管钙化,维生素D在钙磷稳定中起重要作用。而血管钙化正是
目的:观察通阳利水足浴方联合内科治疗脾肾阳虚型失代偿期肝硬化腹水的临床疗效,并评价其安全性。方法:回顾性收集2017年05月至2019年12月至广西中医药大学附属瑞康医院肝病
声子晶体是具有声波/弹性波带隙特性的周期性声学人工结构,当声波在声子晶体中传播时,在特定频率范围或入射角范围内的声波将会受到抑制作用(即声子晶体的频率选择透过性和方向选择透过性),从而无法传播,形成所谓的声波带隙。声子晶体的禁带效应可用于众多声波操控领域,例如,声滤波器、隔声减震、声波单向传输器件设计等领域。目前,声子晶体禁带的形成机制主要包含两种,Bragg散射机制和局域共振机制,相应的声子晶体
目前,基于时间序列的突变理论及检测方法体系已经进行了深入研究,已经取得了大量有用的结果,形成了许多有效的突变检测技术。然而,这些研究未能顾及地理空间变量,割裂了地理变量的时空关联。由于多数地理变量是一个非线性、非平稳的时空对象,隐含了许多地理现象及地理变化的动力学机制。因此,进一步完善空间突变理论体系、发展地理空间变量突变检测方法,对挖掘系统突变中隐含的地理信息以及推动地统计学的发展,具有十分重要
在三维基因组领域,Hi-C技术在研究全基因组交互中扮演关键角色。随着技术的进步,传统Hi-C实验中的数据利用率低,实验周期长,实验成本高等问题逐渐显露。为了弥补这一不足,2018年5月份Nature Genetics发表了一篇关于新的Hi-C技术DLO Hi-C(Digestion-ligation-only Hi-C)。相比于传统Hi-C技术,DLO Hi-C有着测序数据质量高,实验周期短,可重
在过去的几十年里,人们对提高学术论文中知识主张的可靠性和说服力的兴趣日益浓厚。研究发现,学术论文作者普遍使用元话语与其目标读者建立互动,引导读者关注其研究,参与其讨
地区公共产品承载了丰富的内涵,为国际关系研究地区合作议题打开了一扇门。本文围绕地区公共产品供给模式如何生成这一核心理论问题,梳理了公共产品论和国际关系论的相关理论
背景:先天性心脏病是一种由环境因素与遗传因素共同参与的疾病,越来越多的基因及信号通路被发现在先天性心脏病的发病过程中起作用。NODAL是Nodal信号转导通路的主要配体,在