求解特征选择问题的演化优化算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:juntao2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济水平和信息技术水平的高速发展,当今社会已经完全进入了数据时代。但是,这些数据都具备较高的维度,并且数据中很多特征都是无用的,这些特性会造成数据存储空间利用率低下、分类性能降低、运行效率低下等诸多问题。所以,快速而有效地找到最优的数据是必须要考虑并解决的问题。特征选择作为数据预处理的重要手段,在处理大量高维数据以解决分类问题时,可以有效地提高分类问题的分类精度并降低时间复杂度,从而很好地提高机器学习算法的性能。近些年来,演化算法由于具有很好的全局搜索能力而被广泛用于求解特征选择问题。但是,当数据集的维度增加到一定程度时,许多不相关或冗余的特征使诸多方法易陷入“维度灾难”和局部最优等问题。许多现有的演化算法不能有效地解决这类问题,而且大部分研究者都是从参数和结构优化等角度来改进演化算法的性能。为了从不同的角度提升演化算法的性能,更好地解决特征选择问题,特别是大规模的特征选择问题,本文在粒子群优化算法的基础上,主要做了以下研究工作:(1)有效的种群初始化方法可以改进演化算法的收敛性能以求解特征选择问题。但是,现有的研究中,对种群初始化的研究相对较少,而过滤式方法简单且效率较高,可以快速评估和选择有用的特征,尚没有被广泛应用于改进种群初始化。因此,针对此问题,提出了基于过滤式(Filter)和阈值的种群初始化改进的粒子群优化算法(Particle Swarm Optimization with Filter and Threshold Selection-based Population Initialization,FTSI-PSO),并将其用于求解特征选择问题。(2)针对FTSI-PSO算法普适性小、未能充分利用特征之间的交互性等问题,提出基于Filter和概率的种群初始化改进的粒子群优化算法。实验结果表明,该算法在解决特征选择问题时,具备较好的收敛速度和较高的分类性能。(3)针对大规模多目标特征选择问题的局部最优停滞问题,提出了多目标自适应粒子群优化算法。该算法将分类准确度和解大小作为两个目标。在PSO算法的基础上,采用自适应机制、快速非支配排序方法、拥挤度距离计算方法和精英策略构建该多目标特征选择算法。实验结果表明,在解决特征选择问题时,该算法的性能要优于其他的多目标算法。
其他文献
目的探讨单光子发射型计算机断层显像(SPECT)评估肝脏储备功能。方法在46例肝癌患者于术前行SPECT核素扫描,记录5min心肝相关指数、清除指数、受体指数和高峰值。结果术后31例
设计并制作了一种适用于原位纳米力学测试的原子力显微镜(AFM)测头.测头由光学检测系统和Z向压电陶瓷微位移机构组成.其中光学检测系统采用光杠杆与显微镜同轴光路检测探针形
空间危机是晚清以来中国人所遭遇的一切危机的源头,西方人在中国设立租界是空间危机的重要表征。上海是中国最早设立租界的城市,也是最先西化、最国际化的城市。伴随着租界的
目的:用宫腔镜下子宫内膜息肉电切除术治疗子宫内膜息肉的效果。方法:将2016年3月至2017年3月期间文昌市人民医院收治的76例子宫内膜息肉患者作为研究对象。采用随机数表法将其
目的观察恩替卡韦治疗慢性乙型肝炎肝衰竭的疗效。方法对20例慢性乙型肝炎肝衰竭患者在综合治疗的基础上加用恩替卡韦治疗,16例患者为对照组,观察3个月的疗效。结果治疗组存