论文部分内容阅读
文字是人类信息交流的主要载体之一。随着计算机、信息技术的高速发展,使用计算机处理并识别人们的文字信息也就成为了一个非常重要的研究领域。脱机手写体字符识别是模式识别的一个重要分支,它涉及模式识别、图像处理、数字信号处理、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术,在信息处理、办公自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。 由于在脱机手写体字符识别中,处理的仅是二维的字符点阵图像,而且存在字符类别多、字形结构复杂、手写字符的变形很大等问题,目前脱机手写字符识别技术还很不成熟,仍处于实验室研究阶段。本文试图将神经网络技术与模式识别技术相结合,提出若干行之有效的手写体字符识别新方法,为解决手写体字符识别中所存在的困难找到切实可行的新途径。 脱机手写体字符识别的重点与难点在于字符的特征提取与分类器的设计。本文在手写体字符特征提取方法研究中,通过对手写体字符的研究,提取了字符的LLF、中心投影、链码等特征,并将这些特征与传统的字符统计特征和结构特征相结合应用于手写体字符识别系统。由于神经网络的特点及其在手写体字符识别领域体现出的潜力,本文对基于神经网络的手写体字符识别技术进行了大量的研究工作,提出了两种新颖的基于神经网络的手写体字符识别模型,其中,基于混合神经网络的手写体字符识别模型利用了在抗干扰和描述字符拓扑结构方面具有互补性的中心投影特征和LLF特征,使用多神经网络集成技术构建了多级的神经网络分类器。而基于非线性PCA的神经网络识别模型对传统的线性PCA进行了推广,并利用了子空间的模式识别方法,针对每个字符类使用神经网络建立多个模板,然后利用PCA神经网络和聚类算法构造自动编码器组对模式类进行重构,避免了特征提取的复杂性和信息的丢失,提高了系统的识别性能和运算效率。