论文部分内容阅读
人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具有良好容错性的文字识别系统。近年来,围绕仿人脱机手写体汉字图像识别的研究方面取得了很多进展。以每一类事物的“认识”为目的的仿生模式识别理论方法对属于超多类模式识别的手写体汉字识别,是具有理论方法研究意义和实际应用价值的。 文章主要工作如下: 1、分析了人类将汉字拆分为若干基本笔划复合连接交叉所形成的相对不变的拓扑结构来“认知”汉字的识字机理过程,定义了一种基于与横、竖、撇、捺笔段对应方向的双权值椭圆型神经元序列覆盖手写体汉字图像的获取基本笔段方法;给出了手写体汉字图像转化为具有容错表征方式的汉字基本笔划类型(横、竖、撇、捺、折)在不同位置组成的几何图形算法,获取表征基本笔段图形的双权值椭圆型神经元。 2、分析了人类识字中对笔划类型容错性心理过程和拓扑结构辨识过程,归纳了具有冗余容错表征方式的六种汉字笔划合成类型;定义了汉字笔划神经元的合成规则以及笔划神经元的相合相交类型判别规则。 3、仿人类学习、记忆、对比与判断的识字过程,以汉字笔划在汉字图形中拓扑结构的最佳覆盖为目标,定义了表征手写体汉字特征知识的数据结构表;并先验建立了样本汉字的样本知识库;给出了手写体汉字的容错匹配识别方法。 选取SCUT-IRAC手写体汉字库中的手写体汉字图像,对文章研究的手写体汉字仿生模式识别方法进行了验证实验。实验结果说明,该方法具有接近人类识别手写体汉字的容错性和准确性。