论文部分内容阅读
脱机手写数字识别在邮政编码、统计报表、财务报表、银行票据等方面有着极其重要的应用,这些涉及到财会金融等领域的数字识别对识别正确率有着极高的要求,同时要求有极低的误识率;此外,大批量数据处理对系统速度又有相当的要求,这就对识别系统提出了更高的要求,许多理论上完美但速度过低的方法是行不通的。因此,研究高性能的手写数字识别算法是一个有相当的挑战性的任务。神经网络应用于手写数字识别的研究也从单一的神经网向集成的方向发展,由于神经网络集成能显著的提高系统的泛化能力,因此将集成神经网应用于手写数字已成为研究的热点。本文提出了一种基于集成学习算法AdaBoost的手写数字识别系统。AdaBoost算法可以在仅比随机预测略好的弱分类器基础上构建高精度的强分类器。本文对AdaBoost算法进行了深入研究,重点讨论了该算法应用于手写数字识别上的实现方案。具体而言,本论文主要完成了以下几项工作:(1)实现了宏观,微观,局部,整体三个层次九个方面的特征提取,分别应用于九个神经网络分类器。(2)对BP神经网络作了深入研究,并针对BP的局限做了一些改进,来提高网络的收敛速度和避免网络假饱和现象。(3)对神经网络集成应用于手写数字做了深入的分析,提出了AdaBoost集成算法应用于手写数字体识别的解决方案,并做出了实验系统进行验证。测试结果表明该系统在一定程度上提高了手写数字识别的精度,值得进行进一步研究。