论文部分内容阅读
随着模式识别技术的发展,手写汉字笔迹鉴别和字符识别的研究越来越引起人们的重视。汉字字符有其自身的特点:字符种类多,字形复杂,而手写字符又存在书写风格各异的问题。为了满足应用的需求,深入的研究手写汉字笔迹鉴别和字符识别具有广泛的应用价值。本文的主要研究内容和学术贡献有以下几个方面:首先,针对目前采集到的笔迹图像样本的背景、噪声、大小不一等问题,本文设计了一套笔迹图像预处理系统。该方法对于影响图像样本的格线等背景,设计了阈值分割方法进行背景去除;为体现手写字符的书写风格,进行了灰度化和二值化的处理;通过实验比较验证了手写汉字图像的各种去噪方法,选取自适应中值滤波方法对图像进行去噪;最后针对字符或纹理图像样本大小各异的问题,设计了行、字分割和尺寸归一化。整个预处理系统为后续的特征提取效果提供了保证。其次,在文本依存的离线手写汉字笔迹鉴别问题上,提出采用各项异性高斯滤波器对样本进行特征提取的方法,通过实验分析了尺度和角度参数对于特征值的重要性。针对滤波器参数选择耗时过高的问题,提出了结合人工蜂群算法和LDA算法的参数优化方法。实验证明,该参数优化方法可以大幅提高鉴别的时间效率。对于基于文本独立的离线手写汉字笔迹鉴别,针对目前算法存在识别率不高的问题,提出一种特征融合的方法进行笔迹特征的提取。该方法结合了局部二值模式方法的局部特征提取能力强,和多通道分解方法全局特征提取效果好的优点,同时在空域和时域上进行特征提取,应用于文本独立的笔迹鉴别中,取得了不错的识别率。最后本文研究了手写汉字字符识别问题,由于传统的算法在特征提取的过程中容易丢失特征信息,进而导致分类识别率下降,首次选用直接从基本像素入手进行特征提取的卷积神经网络,进行汉字字符识别。这种方法可以同时进行特征提取和分类,减少了中间的环节,有效控制了信息丢失的问题,实验结果证明,本算法在手写汉字字符上可以取得很好的效果。