论文部分内容阅读
脱机手写体汉字识别作为超多类模式识别问题,被认为是当前模式识别领域中的研究难点之一。传统用单一特征表征汉字的方法对手写体汉字识别具有一定的局限性,而采用多特征组合来表征汉字虽可提高特征表示的较完备性,但也会带来特征的多重性和识别的不确定性。本文基于粗糙集理论和变粒度原理,构建了一种脱机手写体汉字识别决策信息系统,以汉字样本的真实属性指导训练过程,探索基于粗糙集和变粒度原理的脱机手写体汉字识别方法。本文的主要研究工作如下:1.构建了脱机手写体汉字识别决策信息系统。基于粗糙集广义信息论,将脱机手写体汉字多种特征融合成一组多维特征向量作为条件属性,将样本汉字的真实属性作为决策属性,构成一种脱机手写体汉字识别决策信息系统。2.给出了一种手写体汉字特征属性分层递阶约简方法。依据粒度理论,定义了脱机手写体汉字特征属性的知识粒度熵、相对粒度熵以及特征属性相对重要度指标,根据属性重要度将汉字特征进行分类,使特征属性在单层次和单粒度上的知识表示变为部分属性所构成的知识在多种层次和多种粒度上的表示,并给出手写体汉字特征属性分层递阶约简算法,弥补了传统单粒度原理分辨率固定,约简不精的缺点,有效地化简了脱机手写体汉字识别决策信息系统。3.提出了一种基于D-S证据理论的规则融合识别方法。针对脱机手写体汉字识别过程中出现的决策规则不能唯一匹配带来的拒识问题,根据D-S证据理论对约简后的手写体汉字识别决策信息系统的决策规则进行融合,提高决策信息系统的泛化能力,从而提高了汉字的识别率。本文从SCUT-IRAC手写体汉字图像样本库中选取30类共1200个手写体汉字图像样本,以MATLAB软件为实验平台,对本文提出的脱机手写体汉字识别方法进行了验证。实验结果表明,本文提出的方法是有效可行的。