论文部分内容阅读
光学字符识别是20世纪20年代逐步发展起来的一门自动化技术。日常生活中会遇到各种各样的数字信息需要录入到计算机中去,如大规模的数据统计、财务、税务、金融及邮件分拣等。因此手写体数字识别有着广泛的应用前景,对其进行研究有着重要的现实意义。 本文对手写数字识别技术进行了研究和探讨,提出了一种动态权值集成的多分类器手写数字识别方法。该识别方法以图像预处理和字符特征提取为基础,采用BP神经网络识别作为核心识别分类器,对多个神经网络识别器的输出向量进行动态权值集成确定最后的识别结果。 在预处理方面,本文着重研究了光照不均字符灰度图像的二值化问题,提出了一种基于高斯拉普拉斯(LoG)算子的边缘零交叉二值化方法,该方法能够适应光照不均和噪声等干扰,其二值化后的字符图像能够很好地保持本来形态。 在特征提取方面,本文提取了三种有效特征向量,分别为原始点阵向量、宏观特征、宏观特征和微观特征。通过分析研究,利用三种不同特征向量进行字符分类,分类结果具有很好的互补性。 分类识别器采用了BP神经网络。对BP神经网络的训练算法进行了研究,提出一种综合优化训练算法,使网络训练速度得到提高,网络收敛也得以保证。将三种不同特征向量作为神经网络的输入,设计了三个不同网络结构的神经网络分类器,并提出动态权值的多分类器集成方法对三个分类器进行系统集成,提高了系统的性能和识别精度。 识别系统对自主采集建立的手写体数字图像库(SHNID)和美国邮政管理局(USPS)手写体数字图像库分别进行了三单分类器和动态权值集成测试实验,单分类器最好识别率分别为98.686%和91.6791%,采用动态权值集成方法集成后的识别率分别达到了98.9152%和92.1774%。实验结果表明该系统对手写数字具有较高的识别率。