双层叠自编码特征在不平衡数据分类问题的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wq999999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能研究与应用的快速发展,机器学习越来越广泛地被应用到生活和生产各个领域上,提高了人们生活质量和生产效率。在实际环境的机器学习过程中,经常会遇到数据的不同类别样本分布不均匀的现象,称之为不平衡数据问题。由于样本分布不均匀,在不平衡数据下的分类问题中,分类器以最小平均损失为优化目标,容易造成分类器预测标签倾斜向多数类,从而影响分类器的实际使用价值。目前解决不平衡数据分类问题的方法主要有基于重采样和集成学习、基于代价敏感等方法。基于重采样的方法简单、独立于分类器,但随机性大,容易造成样本重要信息缺失或样本空间重叠造成过拟合。重采样结合集成学习,能降低重采样造成的扰动,提高在不平衡数据上的分类性能。基于代价敏感方法简单直观但难以定义合适的代价损失函数。事实上,分类器在于数据分布边界清晰的不平衡数据也可得到较好的效果,而面对数据样本空间重叠、特征不明显的不平衡数据时,通过特征学习得到的特征,若能够提供清晰的分类边界,那么重采样就不一定是必要的,因而也可以从特征的角度出解决不平衡数据分类问题。本论文从特征的角度去解决不平衡数据的分类问题,提出了双层叠自编码特征,通过两个独立的用不同激活函数激活的层叠自编码器生成两套特征,两套特征由不同激活函数激活的层叠自编码器得到,分别捕获了原数据较为全局、稳定和局部、细节的特征。两套具有不同特性的特征组合起来,具有更好的表达能力。样本经过双层叠自编码器生成的特征,从原来的特征空间转换到新的特征空间进入分类器,分类器从而更容易获得合理的分类边界。四个不同的实验,对比了双层叠自编码特征和使用单一的激活函数的单个层叠自编码器的特征、其他基于重采样和集成学习算法以及特征转换方法在人工数据集的分类边界和14个UCI数据集上的表现,验证了双层叠自编码特征能获得在不平衡数据环境下,获得更优的分类边界和分类性能。
其他文献
威廉·爱德华·伯格哈特·杜波依斯是20世纪初最有影响力的黑人活动家之一。他是第一个获得哈佛大学博士学位的非裔美国人,一生致力于黑人的解放事业,是美国社会学家、民权运
目的:分析HPV16 E7蛋白检测对宫颈癌前病变的诊断价值和其对判断HPV16感染导致的不同级别的宫颈癌前病变预后转归的风险评估的效能。方法:选取在2016年9月至2017年12月期间因HPV16阳性就诊于天津市中心妇产科医院门诊并行阴道镜检查及宫颈活检术,经病理学诊断为HSIL及以下的180例患者为研究对象,统计分析患者的临床资料,并采集宫颈脱落细胞,使用酶促化学发光法检测HPV16 E7蛋白浓
热管以其优越的导热性、等温性以及热流密度的可变性,已经被应用到通风系统中,在交换室内外空气的同时,达到了预热预冷新风的目的。目前用于通风换气的热管制造工艺复杂,并且
图灵奖得主Adleman首次提出DNA计算的概念。作为交叉学科的DNA计算具有强并行处理,高存储、快运算、低耗能等优点,因此引起各界学者的广泛关注和研究。发展至今,DNA计算由理
中国特色社会主义进入新时代,这是我国发展的新的历史方位,也是大学生成长成才新的现实背景。在实现中国梦的进程中,大学生发挥着关键性作用,其社会责任感的强弱也至关重要。当前我国正处于百年未有之大变局,在各个领域都面临着诸多机遇和挑战。调查研究表明,总体上当代大学生的思想水平是积极的、健康的、向上的,但是也有部分学生存在社会责任感淡薄的现象。因此,加强新时代大学生社会责任感培育工作是十分紧迫的命题。本论
近年以来我国大城市中地铁已经成为日常生活中不可或缺的交通工具,它极大的方便了人们的出行便利,同时也缓解了地上道路交通系统的压力。但因乘坐地铁人数的增加远远高于现阶
氢气,甲烷作为高热值,低污染的清洁能源,能够有效缓解日益严重的环境污染问题,在电力发电领域具有巨大的发展前景。随着重型燃气轮机飞速的发展,带动社会经济稳步前进的同时也带来严重的污染排放问题。本文采用数值模拟的方式在维持燃气轮机功率不变的情况下,在甲烷燃烧的过程当中添加一定体积的氢气量,研究甲烷燃烧过程中氢气含量的变化对燃气轮机运行的影响,主要包括温度变化情况,速度变化规律,燃料的燃烧以及燃烧产物的
近年来,随着集成电路工艺水平的不断提升,CPU的计算能力越来越强,与外部存储器的工作速度差距也越来越明显。Cache的引入在一定程度上缓解了“存储墙”的问题。分析和理解应
随着大数据时代的到来,数据中心的规模逐渐变大,连接数据中心内部和外部的网络规模也以指数级增长,网络工程师对于数量暴增的网络设备的管理变得更加复杂。为了灵活配置和管
本文梳理了灵活保障就业的基本理论,探讨了吉林省弱势群体的灵活保障就业的实践发展,我省弱势群体劳动力市场的灵活性和保障性均有一定的发展,但保障性略显不足。通过特定范