论文部分内容阅读
字符是人类进行信息交流的重要工具。随着国家信息化进程的加快,手写字符识别的应用需求将越来越广泛,因此应当加强这方面的研究工作。经过长期的工作,脱机手写体字符识别的研究受到更多关注,在字符的分割、预处理等方面已经取得了大量的成果,技术已经趋于成熟。但在字符的识别方面,由于脱机手写字符识别处理的仅是二维的字符点阵图像,而且存在字符变形大等原因,使得实现高效的手写字符识别存在一定的困难。此外,传统统计模式识别的方法是在样本数目足够多的前提下进行的,只有在样本数趋于无穷时才能获得较好的效果。但在实际问题中,样本数通常是有限的,这时原有方法都难以取得理想的结果。然而,统计学习理论是专门为小样本设计的,它的出现为研究有限样本情况下的统计模式识别建立了一个较好的理论框架,并推出了一种新的模式识别方法——支持向量机SVM。它是一种普遍适用的方法,已经广泛的用于模式识别、回归估计、函数逼近、密度估计等方面。本文的研究对象为特定人手写体数字(包括10个阿拉伯数字)。根据实验需要采用了自己建立样本库的方案。通过在VC++6.0环境下的编程进行了仿真实验,完成了字符从输入到计算机识别的全过程。在输入阶段,通过鼠标拖拽实现了字符的输入。在预处理阶段,对字符进行了平滑、锐化、细化的预处理,使得以后的特征提取和识别因而变得容易。在特征提取阶段,采用一种较简单的模板法有效提取了字符的特征。在识别阶段,对特定人手写数字用支持向量机方法进行了识别。在输出阶段通过弹出的对话框中的内容实现了结果的输出。此外,通过比较不同惩罚因子、核函数及其参数对识别率的影响,找出了用支持向量机方法针对特定人手写数字识别的一条较好的途径。为了说明支持向量机方法的优劣,还与其余常用的识别方法进行了对比分析。结果表明基于支持向量机的识别方法明显较优。