论文部分内容阅读
光学字符识别是20世纪20年代逐步发展起来的一门自动化技术。日常生活中会遇到各种各样的数字信息需要录入到计算机中去,如大规模的数据统计、财务、税务、金融及邮件分拣等。因此手写体数字识别有着广泛的应用前景,对其进行研究有着重要的现实意义。
本文对手写数字识别技术进行了研究和探讨,采用基于LM-BP神经网络分类器的手写数字识别方法。该识别方法以图像预处理和一定的字符特征提取为基础,采用结合了LM数值优化法的BP神经网络作为核心识别分类器,对点阵输入向量进行分类识别而确定出最后的识别结果。
在预处理方面,本文着重研究了带折线型断笔的字符的断笔连接问题,提出了一种端点特征提取法,结合DDA算法,形成了一种能连接多种折线型断笔的新方法。此外,针对二值图像的特点,修改了传统中值滤波法的具体运算方法,提出了一套快速的运算规则。另外,使用形态学膨胀技术粗化细化后的字符,均匀化了字符笔画,用做分类器的输入。
分类识别器采用了LM-BP神经网络。对传统的BP神经网络训练算法进行了研究,采用综合优化训练算法,使用LM数值优化算法进行权值与阈值修正,并引入了自适应调节参数,灵活地调节网络训练方式。
识别系统对美国邮政管理局(USPS)手写体数字图像库分别进行了传统BP神经网络和LM-BP神经网络测试实验,传统BP神经网络的最好识别率为92.722%,LM-BP神经网络的识别率达到了96.611%,实验结果表明该系统对手写数字具有较高的识别率。