论文部分内容阅读
支持向量机(Support Vector Machine, SVM)算法是以统计学习理论为基础的一种机器学习方法,它以其扎实的理论基础以及完整的理论推导,成为处理小样本学习、非线性、局部极小值等问题的有效工具。之前的神经网络学习方法,时常在速度、稳定性以及泛华能力方面出现种种问题,但是支持向量机方法却在这些方面达到了较为满意的效果。由于支持向量机算法通常研究的是均衡状态下数据的分类,然而在数据不均衡的状况下,效果很不理想,因此对于处理不均衡数据下支持向量机算法的研究成为了近些年很多学者们的关注对象。在支持向量机算法的基础上对数据层和算法层上进行改进,可以使数据达到均衡。在数据层的处理方面,少数类数据通常运用过采样的处理方式,而多数类数据通常都是使用欠采样的方法作出改进。本论文对于如何使不均衡数据通过欠采样方式达到均衡,提出了两种不同的算法,一种为基于谱聚类欠采样不均衡数据SVM算法,另一种为基于精简集欠采样不均衡数据SVM算法。谱聚类欠采样算法在处理数据层上时,将多数类数据在核空间里使用谱聚类方法,对具有代表性的数据点与少数类数据进行样本训练,在得到良好的分类界限的同时提高了分类性能,并在算法的最后与其他不同算法进行了对比。基于精简集欠采样不均衡数据SVM算法除了考虑不均衡数据SVM分类性能,还对算法的速度进行了一定研究与学习,该算法在保持原多数类数据空间结构不变的前提下,在核空间中进行精简集算法处理,通过对多数类数据权重的确定和数据样本到多数类数据中心的距离选择出具有代表性的向量。由于算法是对于精简集的支持向量进行训练,所以在运算速度上有大大地提升,在算法的最后同样与其他分类算法进行了对比分析。本论文的最后将提出的谱聚类欠采样算法应用到了故障检测的领域,在轴承检测上分别对滚动体故障、外圈故障以及内圈故障进行了相关数据的相应检测,同时对检测中的参数在算法中所起到的作用加以分析,使该算法应用到实际情况之中,让支持向量机算法在不均衡数据处理方面得到真正的应用。