论文部分内容阅读
分类问题是实际应用中普遍存在的问题,也是机器学习领域的基础研究之一,快速发展的信息技术对其在理论研究和实际应用中提出了许多新的难题和挑战。支持向量机是建立在统计学习理论基础上的新型机器学习方法。它根据有限样本信息在模型的复杂度和期望风险之间寻求最佳方式,从而获得更好的泛化性能。与传统的学习方法相比,支持向量机具有泛化能力强、维数不敏感、收敛到全局最优等优点,较好地解决了传统算法容易出现的过学习、局部极值、维数灾难等棘手问题,成为近几年机器学习领域中的一个非常活跃的研究热点。本文对基于支持向量机的分类算法进行了深入的研究,完成的主要内容如下:1.针对不平衡数据分类问题,本文提出了一种基于Smote与核函数修改相结合的算法。首先在数据层面上利用Smote方法对数据进行处理,降低原始数据的不平衡度。然后在算法层面上,对核函数进行修改,扩大少数类和最优分类超平面的间隔,有效的提高了分类器的泛化性能和少数类的准确率,较好的解决了不平衡数据分类问题。2.研究了基于二叉树支持向量机的多分类问题,针对传统二叉树算法中点和叶划分盲目,误差累计等缺点,提出了一种新的二叉树SVM多分类算法。该算法合理利用了子分类器的分类信息,大大减少了子分类器的数目,经仿真分析,无论是在时间还是正确率方面都达到了令人满意的效果。3.对核函数进行研究,重点讨论了核函数SVM的基本特性﹑构造问题。在此基础上,提出了一种基于混合核函数的分类方法,用以处理不平衡数据,取得了良好的效果。