【摘 要】
:
分类是数据挖掘技术研究的热点之一。多标签分类是针对越来越多的多标签数据提出来的,并且已广泛应用于基因功能的检测、多媒体内容的自动标注等多个领域。现今多标签分类面
论文部分内容阅读
分类是数据挖掘技术研究的热点之一。多标签分类是针对越来越多的多标签数据提出来的,并且已广泛应用于基因功能的检测、多媒体内容的自动标注等多个领域。现今多标签分类面临着特征数目过大引起的维度问题,多标签特征选择算法就是为了剔除分类任务中存在的大量冗余和无关特征,达到减少特征数目,提高分类器性能的目的。本文从不同角度设计了两个多标签分类的特征选择算法——FI-ARML算法和Mult-ReliefF算法。首先,根据关联规则能够发现数据中属性之间的关联关系,提出了基于频繁项集的特征选择算法——FI-ARML算法。该算法改进了基于邻域粗糙集的多标签特征选择算法,主要分为四个步骤:第一,构建基于类别标签的频繁k项集;第二,对训练样本按照标签集合进行划分;第三,计算每个子样本的特征子集;第四,合并所有特征子集从而得到最终的特征集合。实验表明,FI-ARML算法能在分类效果相当的情况下,大大提高特征选择的速度,达到缩短时间的目的。然后,针对ReliefF算法局限于单标签数据问题,提出了多标签特征选择算法——Mult-ReliefF算法。该算法重新定义了类内最近邻和类外最近邻的查找方法,能直接适用于多标签数据,并加入标签的贡献值更新特征权重公式。实验表明,Mult-ReliefF算法能提高分类精度,获得更好的特征子集。
其他文献
本文研究WSN(无线传感器网络)能量有效的覆盖控制技术。考虑到无线传感器网络节点自身能量有限,并且能量补充难度大、成本高,能效问题始终是WSN研究领域的核心问题。WSN的设
随着移动互联网、云计算、大数据等互联网技术的快速发展,网络建设的规模不断扩大,新型的网络架构也层出不穷。为了增强网络的健壮性,传统网络大都存在超额资源供给和冗余设
软件定义网络(Software Defined Networking,SDN)是近年提出的一种创新型的网络架构,其核心思想是控制与转发分离,使得网络具有可编程的特性。与传统的网络相比,SDN可以简化
小麦(Triticum aestivum L.)是世界上主要的粮食作物,培育新品种在小麦产量提升的过程中起着十分重要的作用。小麦育种过程中促使其生长发育特征发生了显著的变化。包括小麦的
课堂提问作为课堂信息输出和反馈之间重要的沟通手段,它是教师在教学活动中一项重要的教学技能。众所周知,在日常的课堂教学中,提问是课堂中很常见的互动环节,而发生在英语课堂中的提问,不仅能够拉近师生之间的距离,增加交互,同时更是一种语言习得的方式。研究表明,在英语课堂中有效的提问不仅可以激发和培养学生内在的学习动机,而且能够引导学生在课堂上利用目的语进行有意义的交际。为了了解目前小学英语教师课堂提问有效
针对序列图像三维重建中目标物体存在遮挡物以及三维表面重建存在孔洞导致真实感显示失真的问题,本文致力于研究一种还原目标物体纹理以及一种三角网格孔洞修补的算法。主要
随着计算机技术的飞速发展以及传感器性能的不断提升,视频目标跟踪技术在智能交通、安防监控系统等实际应用中的作用日益凸显,成为当前计算机视觉和人工智能领域的研究热点和
融资租赁产生于20世纪50年代的美国,伴随着行业60多年的发展,融资租赁已经成为金融系统当中不可或缺的部分,融资租赁在许多发达的国家已成为第二大的融资工具,仅次于银行。我
网络虚拟化成为未来网络的重要发展方向之一,核心思想是实现多个相互隔离的虚拟网络共享物理网络资源。虚拟网络映射(VNE,Virtual Network Embedding)问题是网络虚拟化技术的
在线社交网络的发展与普及给人们的日常生活带来了极大的便利,如今每天有多达数十亿的用户活跃在社交网络上,产生了大量的社交信息。其作为巨大的信息交流与分享的生活服务平