层次多标签分类算法研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ytx45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在常见的分类任务中,一条样本通常属于类别标签之间没有关系的标签集合中的一个标签,而在更加复杂的分类任务中,一条样本可以属于多个标签,通常称为多标签分类。此外,还有一种情况是标签集合中的类别标签以分层的方式进行组织,并且必须将一条样本关联到这个层次结构中的单一路径,即所谓的分层分类。最后,在更复杂的场景中,类别标签同样被组织成一个层次结构,并且一条样本可以关联到这个层次结构的多条路径,即层次多标签分类问题,本文提出两种分类算法去解决这个问题。一种是基于路径选择的层次多标签分类算法,该算法为每一个父节点训练一个多类分类器。在分类阶段,当某条标签路径的概率较低时就将该节点所包含的子树剪去,以达到预测路径未到达叶子节点就终止的情况。该方法考虑层次结构中从根节点开始的所有可能路径,通过结合路径上的节点在层次结构中的层次和局部分类器的预测值来计算各条路径的得分,最后通过选择路径得分超过给定阈值的一条或者多条路径上的标签节点作为最后预测结果。另外一种是基于神经网络的层次多标签分类算法,该算法为层次标签树的每一层都单独训练一个神经网络模型,并将这些神经网络模型链接成神经网络链做为最终预测模型。同时,拼接各层神经网络的输出作为最终输出。最后,再分别通过单阈值选择和多阈值选择来预测最后的标签集。本文将层次多标签分类算法应用于大规模网络智能运维工作票分类任务,并开发基于BS架构的层次多标签分类系统。实际的运行结果表明:本系统可以很好地实现层次多标签分类,并对多标签分类树和多标签分类结果进行有效可视化。
其他文献
采用转炉的方式是现在主流的炼钢手段,在转炉炼钢过程中,化渣是其中的一个关键过程。自动炼钢要求利用计算机技术对化渣状态准确、及时判定,作为控制系统实时调控的依据,使得炼钢
自九十年代产生以来,数据挖掘技术的研究已经比较深入,研究范围涉及到关联分析、分类分析、聚类分析、趋势分析等多个方面。在常见的非结构化数据如文本、图像、视频中,文本数据
随着通信技术和计算机技术、尤其是Internet的飞速发展,各种各样的信息成几何级数增长,作为传统的信息载体,文本信息更是如此。为了能在海量纷杂的文本信息中及时准确地获得
从大型数据集中发现有趣的,有用的且预先未知的知识的过程被称为数据挖掘。数据挖掘又称数据库中的知识发现,是数据库研究最活跃的领域之一。通过数据挖掘可以从大型数据集中提
本论文所讨论的数据清洗是通过对数据库海量数据冗余信息的匹配、探测并去除错误数据和矛盾数据、提高数据质量的过程。数据质量问题出现在多个数据集合之间。由于出现数据输
Web服务是一种崭新的Web应用,是SOA(Service-Oriented Architecture)的核心。在Web服务以及SOA中,存在三个不同的角色(服务提供商、服务代理商和服务请求者),三种基本操作(服务
随着互联网的发展,数据呈现爆炸式的增长,大量的文档不断涌现,而聚类分析可以从这些文档中获取大量的有用信息。因此如何高效地对文档进行聚类并应用于文本挖掘和信息检索的
Ad Hoc网络高度动态的拓扑结构,无线传输,无中心,多跳路由,分布式等技术特点,使得传统路由协议不再适合于这种网络,因此Ad Hoc网络路由协议的研究与设计成为了当前Ad Hoc网络领域研
在如今这个互联网飞速发展的时代,防火墙作为抵御网络攻击、保护网络安全的工具,早已被普遍地应用于各种网络环境中。因此,防火墙的质量如何,能否有效地保障用户网络的安全就
流媒体课件是现代网络教育中的重要资源,是实现数字化教学的基础。由于流媒体课件制作涉及到流媒体素材的采集和编辑、网页制作、脚本语言控制、交互功能等许多技术,具有制作