论文部分内容阅读
支持向量机是基于统计学习理论发展起来的一种新颖的机器学习方法,它是专门针对小样本数据而言的。支持向量机具有一些不同于其他机器学习方法的独特优点,如间隔最大原则,核函数技术应用,泛化能力强,可调整参数少,能达到全局最优等。正是由于这些优点,支持向量机在很多领域得到了广泛应用。然而,对于大规模数据在训练过程中需要占用很大的存储空间,计算量也非常大,造成了支持向量机的训练速度非常缓慢。在支持向量机训练过程中大量的非支持向量不起作用,只有一小部分支持向量决定着分类边界面,基于这种想法本文提出了一种基于样本约简的支持向量机方法。首先采用支持向量域描述算法构造最小超球,利用内积的一些基本知识去掉球外部分可能的非支持向量样本点,再对球内样本点和球外剩下的样本点利用距离去边缘点,得到最终训练样本集。实验证明了本文方法的有效性,在不损失测试精度情况下大大减少了训练时间,尤其对于样本数目非常大的数据,此方法更为适用。