论文部分内容阅读
支持向量机是由Vapnik等人在统计学习理论基础上发展起来的一种新型机器学习方法,是一种解决小样本问题的强有力工具,在众多领域得到了广泛的应用。本文主要对孪生二叉树支持向量分类机相关问题进行了研究,本文主要内容如下:在第一章中,简单介绍了支持向量机的研究背景,并从新的支持向量机模型、训练速度、多分类算法这三方面阐述了支持向量机的研究现状。第二章,我们详细介绍了最优分类超平面、线性(非线性)支持向量机与线性(非线性)孪生支持向量机的理论基础及相关原理。第三章,针对二叉树支持向量机多分类方法存在的缺点,我们考虑了类间的分离度的影响,结合完全二叉树和偏二叉树两种结构,并用孪生支持向量机在二叉树中的决策节点进行训练得到了BT-TSVM和PBT-TSVM两种多分类算法,通过时间复杂度分析可知BT-TSVM和PBT-TSVM两种算法均优于OVA-SVM,又通过引入坐标轮换法与收缩技术,从而得到了CCBT-TSVM和CCPBT-TSVM两种快速的多分类算法。第四章,针对第三章提出的算法,我们进行了数值试验仿真。采用人工数据集,从非线性分类器的结果中分析可得,在数据集2中CCBT-TSVM不仅拥有最高的分类准确率95%,而且训练速度比BT-TSVM缩短了5%,比OVA-TSVM缩短了94%;对于真实数据集(UCI),在Ecoli上,CCPBT-TSVM的分类准确率比OVA-SVM提高了7%,比BT-TSVM提高了3%,训练速度比OVA-SVM缩短了97%,比BT-TSVM缩短了近1%,在Glass上,CCBT-TSVM的分类准确率最高,训练速度比OVA-SVM缩短了93%。数值试验表明:我们的算法整体性能均优于OVA-SVM,特别是在处理数据规模较大且稀疏性较强的问题时,CCBT-TSVM和CCPBT-TSVM这两种算法的时间优势更为明显。第五章,总结了本文的主要内容及相关结论,并对今后的研究工作做了进一步展望。