基于Fisher Score及遗传算法的特征选择方法研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:zdhxhx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是机器学习领域研究的热点之一。本文通过介绍特征选择的相关背景及研究意义,分析一些特征选择方法的优缺点,利用过滤式和封装式这两类特征选择算法的互补性,提出一种基于Fisher Score及遗传算法的混合式特征选择方法。该方法先对所有特征的Fisher Score作一个线性变换,再利用变换后的Fisher Score生成遗传算法的初始种群,接着借鉴精英保留策略,用遗传算法的后续运算选出特征。以Sonar,WDBC,Arrhythmia,Hepatitis这四个数据集作为实验数据,用该方法分别选出它们的特征子集,再依据所选特征子集对原数据集降维,用1-最近邻分类器对降维后的样本分类,通过10重交叉验证法分别获得72.36%,95.64%,72.04%和87.83%的分类准确率,并且所需的迭代次数较少,特征选择的综合效果基本优于Fisher Score法(FS)、遗传算法(GA)和Fisher Score+遗传算法(FSGA)这3种对比方法,同时该方法能很好地剔除冗余特征,选出具有较高鉴别力的特征,是一种有效的特征选择方法。
其他文献
本文主要讨论了M(o)bius变换群的离散准则和复双曲几何中Cygan度量不等式,具体安排如下: 第一章,主要介绍所讨论问题的一些背景,给出了主要结果。 第二章,介绍了有关M(o)biu
近年来,在数学,物理,化学,生物学,医学,经济学,工程学,控制理论等许多科学领域中出现了各种各样的非线性问题,在解决这些非线性问题的过程中,逐渐形成了现代分析学中一个非常重要的分支
生态系统的持久性和周期解的存在性问题是数学生态学理论中的一个重要研究内容,历来受到生态学家与数学家的广泛重视.研究非自治的捕食系统解的定性性质,在实际应用方面有着