论文部分内容阅读
在信息时代的今天,手写数字识别技术在文献检索、办公自动化、邮政系统、银行票据处理、表格录入等方面有着广阔的应用,因此手写数字识别技术的研究具有重大的现实意义。由于识别对象所特有的复杂性,使得识别系统的实现具有很大的难度,但现实生活中需要广泛的应用手写数字识别,因此一直以来它都是研究的热点。目前识别手写数字的方法主要有决策树、神经网络和支持向量机(Support Vector Machines,简称SVM)方法,SVM方法自从上世纪90年代被提出以来,就一直是手写数字识别领域的热门方法。训练SVM等价于解一个线性约束的二次规划问题,使得分隔特征空间中两类模式点的两个超平面之间距离最大,而且它能保证得到的解为全局最优点,使得基于SVM的手写数字分类器能够吸收书写的变形,从而具有较好的泛化能力。但是基本的SVM是针对两类的分类问题,为了实现对多类手写数字的分类识别,需要对SVM进行推广。本文介绍了传统的SVM多分类方法,如OVA(One-versus-All)、OVO(One-versus-one)和DAG(Directed Acyclic Graph SVM),并提出一种新的二叉树多分类SVM算法:把多个类别分成两个子集,其中相近或相似的类别放在一个子集,再分别对两个子集进行不断的二分,递归下去直到通过多个二分SVM分类器能把每个类别分开。通过理论证明和实际测试,说明该方法在训练时间、速度、训练集大小等方面比起传统的SVM多分类方法有一定的优势。