半监督联合训练分类方法研究及其应用

来源 :福建师范大学 | 被引量 : 0次 | 上传用户:icetuping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
常规的监督分类算法需要有大量的有标签数据才能构建出很好的分类模型,从而获得比较好的分类效果,但是现实中的情况往往难以满足这个条件,因此能够挖掘未标签数据中所包含的大量信息的半监督分类方法有重大的现实意义。本文对最重要的半监督分类算法之一的联合训练算法进行研究。在联合训练采用的分类器组合结构方面,对传统的两个分类器进行了改进,额外增加了仲裁分类器以弥补前两个分类器的不足,并提出了相应的分类器选择方法。此外,对数据集质量方面也进行了改进,提出了符合分类器结构的新颖训练集处理方法,构造出最.有利于分类的训练集,而因此被删除的点所引起的信息量损失由半监督分类从未标签数据中挖掘进行弥补。在半监督分类的过程中,如果错误标记的点被加入训练集中会影响分类效果,本文采用改进的最近邻规则方法对每一轮新标签进行检查,防止错误标记的数据加入到数据集中,提高了模型的健壮性,保证了选中的未标签数据点的安全性。在保证安全性的同时不可避免的删除部分未标签数据。在一些情况下,未标签数据也是有限的,尝试采用针对不平衡数据的SMOTE算法来补充更多的信息量,弥补为保证数据安全性造成的信息量损失。实验结果表明采用本文的算法比传统的联合训练算法有着更好的分类效果。
其他文献
随着网络和通信技术的发展和提高,办公自动化(Office Automation,简称OA)在技术和应用方面都得到了更高层次的发展。基于协同工作的办公自动化使工作流技术成为办公自动化的
学位
随着计算机和网络技术的高速发展,计算机应用越来越广泛和深入。因特网在给人们生活带来方便的同时,也带来了许多预料不到的问题,网络安全就是其中一个比较突出的问题。虽然
传统的企业商务系统能够支撑企业正常运行,但受到时间、地点等因素的限制。如何打造快捷、高效、实用、安全、低成本的企业运行环境,成为企业发展的障碍。移动商务正是在这种需
学位
流媒体是以流的方式在网络上传输多媒体数据的技术。流媒体服务已经成为互联网上的主流应用;同时,智能移动终端在人们的生活中扮演了越来越重要的角色。通过移动终端来访问流
学位
随着水文学、计算机科学和地理信息系统的发展,水文研究进入了一个全新的时代。分布式的水文模型由于其物理意义明确,正在逐步取代集总式模型。分布式水文模型在研究人类活动
网格计算是建立在互联网上的广域网络计算技术,它将地理上分散的各种资源有效整合起来,提供以资源共享为目的的高性能计算和信息服务的环境。任务调度算法的研究,直接关系到网格
小麦是中国粮食生产系统中的重要组成部分,虽然我国小麦总产量实现了10年连续增长,但是“粮食连续增产的时间越长,可能离减产的拐点也就越近”的危险始终存在。环渤海低平原
溢油事故的频繁发生,严重威胁着沿海城市生态、环境、经济的可持续发展,并日益受到国际社会的重视。溢油事件发生后,为了积极有效地采取相应的应急措施,有必要掌握溢油的位置、分布范围和溢油量等信息,而溢油图像目标的边缘提取是估算溢油分布范围和溢油量准确与否的关键。目前,利用航空并结合卫星遥感方法监测海洋溢油污染仍是大多数国家普遍使用的方法。合成孔径雷达(SAR),由于其不受天气条件的影响,在海上溢油监测中
以计算机为工具,对DNA序列数据进行储存、检索、分析是生物信息学(Bioinformatics)的基本内容。它是当今生命科学和自然科学的重大前沿领域之一。近年来,随着世界各国对不同物
无线传感器网络的节点具有能量有限的特点,因此能耗问题是各层协议研究的重要方面。周期性地调度节点进入睡眠状态,是目前认为节省电量的有效方法之一。虽然睡眠调度能够降低
学位