非平衡数据下的核方法分类研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zt20032053
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非平衡数据分类问题广泛存在于现实世界中,如医疗诊断、雷达图像监测、诈骗检测等。由于其固有的不均匀特性,即正负样本数目相差悬殊,导致了传统的分类算法的有效性降低。因此如何对其有效的准确分类已经成为当前机器学习和模式识别领域中的研究热点之一。本文的研究工作主要以传统的核方法为基础,通过新的过采样方法以及结合基于不同惩罚因子的支持向量机学习算法,来达到优化非平衡数据分类性能的目的。本文的主要贡献有:(1)针对非平衡数据中的不平衡问题,提出了在核方法里的象空间进行数据处理的方法即SMOIS(Synthetic Minority Over-sampling In Image Space)方法。该方法不同于在数据原空间中产生新合成的少数类样本的策略,而是通过在映射后的象空间(Image Space)里引入非重复性的人造少数类样本,以减少分类算法对少数类样本的敏感度,实验结果表明,在ROC曲线和g-means评估度量上该方法能达到一个更好的分类性能。(2)支持向量机方法(SVM)是一种有效的分类学习算法,但在处理非平衡数据时,效果往往不尽人意。因此本文将SMOIS方法与改良的支持向量机算法结合起来,提出基于SMOIS的支持向量机学习算法,从而达到有效分类非平衡数据的目的。本文的研究内容是当前的热点问题之一。该研究成果不仅具有重要的理论意义而且也具有直接的应用价值。
其他文献
无线传感器网络是由随机分布的集成了感知模块、数据处理单元和通信模块的微小节点,通过自组织方式构成的网络,其目的是协作地感知、采集和处理网络覆盖区域中感知对象的信息,获
为了促进以手机电视为代表的移动流媒体应用,DVB组织提出DVB-IPDC应用框架来融合当前数字广播与移动通信网络的相关服务。通知框架规范是DVB组织最新提出的有关DVB-IPDC应用框
随着企业规模和应用业务量的快速增加,业务终端分散化是一种发展趋势,采用有效的方法管理和控制终端中应用程序运行状况和信息的使用十分关键,开展相关理论和技术的研究具有
运动目标检测与跟踪是计算机视觉中一个重要的研究方向,它融合了计算机图像处理、模式识别与人工智能等诸多相关领域的知识,并在军事视觉制导、机器人视觉导航、智能人机交互、
随着计算机技术的迅速发展,信息越来越呈现出海量化和多样化的特征。传统的信息检索技术只擅长处理结构化数据,为处理大规模文本等非结构化数据,一种新的信息检索技术——全
随着信息技术及多媒体技术的迅速发展,人们获得的诸如图像、视频等信息也越来越多。图像识别在最近几年已经被广泛研究与应用,而人脸识别在其中占有非常重要的地位,其在身份
生物特征识别技术因其稳定性、唯一性、便携性、安全性等优势使得人们相信不久的将来将逐步地取代传统的身份认证方式。掌纹作为一个重要的生物特征,在过去的十几年中已经吸
近年来,随着对等网络(Peer-to-Peer,P2P)规模、信息量和用户量的飞速增长,P2P技术成为人们研究与关注的焦点。在P2P网络中,节点既是客户机,享用其他节点提供的服务,同时又充当服务
航空发动机是飞机、飞艇等航空装置的动力提供设备,主轴轴承作为航空发动机的重要组成部分,长期在高温、高压、高转速等复杂条件下运行,对航空装置的飞行安全起着至关重要的
信息技术(Information Technology,IT)与业务的不断融合、体系架构的不断完善,迫切要求对IT业务及其实现支撑业务的IT资源进行适当的管理,使之符合企业业务运作的需要并保证