论文部分内容阅读
随着信息获取手段和处理能力的提高,信息量越来越大,信息维数也越来越高,给模式识别系统的设计带来“维数灾难”的问题,同时大量冗余或无关的特征也会影响识别的速度和准确率。对于支持向量机这样优秀的分类器也存在这样的问题,一些研究学者已经证明在使用支持向量机进行模式分类之前,有必要进行特征选择,以提高分类的准确率。
本文系统综述了支持向量机、微粒群优化算法、特征选择方法和系综方法的发展概况,以支持向量机分类器为背景,以封装模式的特征选择问题为主要研究对象,重点研究了特征选择的搜索算法,并在此基础上研究基于特征选择的分类器系综方法。本文主要的研究成果和创新点如下:
1.在微粒群优化算法中,针对实数微粒群优化易于陷入局部最优的缺点,提出带有全局变异算子的微粒群优化算法,仿真实验表明,改进的算法具有搜索成功率高,速度快的优点;针对离散微粒群优化算法搜索成功率低的缺点,在算法的转换函数中引入了调节参数和偏置参数,提高了算法的适应能力,仿真实验证明,改进算法的在解决局部极值复杂问题时搜索成功率大大提高;另外还通过仿真实验对比了微粒群优化、离散微粒群优化和遗传算法的搜索效率,给出了不同算法的搜索效率评价方法。
2.提出了以离散微粒群优化为搜索算法的特征选择方法,采用封装模式特征选择,以支持向量机的分类准确率为主要评价指标,利用离散微粒群优化进行特征子集选择,仿真实验表明,经过微粒群特征选择,提高了分类准确率。
3.提出了基于微粒群特征选择的系综方法,进一步提高了分类准确率,充分利用不同特征子集包含的互补信息和离散微粒群优化过程中粒子不易凝聚的特点,在特征选择过程中选择多个准确且多样的特征子集,训练出多个支持向量机,然后将它们的结果组合输出;在组合阶段提出了分类器加权/随机组合策略,有效地解决了多分类的投票问题,仿真实验证明了提出方法的有效性。
4.将上述方法用于键盘用户身份识别,进一步验证了本文提出的方法在实际问题的应用效果。针对键盘用户身份识别属于异常检测问题,将一分类支持向量机作为分类器,解决了在训练阶段只有正类数据可用的问题。实验结果表明本文提出的方法的有效性和可行性。