基于动态权值集成的手写数字识别研究

来源 :广东工业大学 | 被引量 : 8次 | 上传用户:shz0414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别是20世纪20年代逐步发展起来的一门自动化技术。日常生活中会遇到各种各样的数字信息需要录入到计算机中去,如大规模的数据统计、财务、税务、金融及邮件分拣等。因此手写体数字识别有着广泛的应用前景,对其进行研究有着重要的现实意义。 本文对手写数字识别技术进行了研究和探讨,提出了一种动态权值集成的多分类器手写数字识别方法。该识别方法以图像预处理和字符特征提取为基础,采用BP神经网络识别作为核心识别分类器,对多个神经网络识别器的输出向量进行动态权值集成确定最后的识别结果。 在预处理方面,本文着重研究了光照不均字符灰度图像的二值化问题,提出了一种基于高斯拉普拉斯(LoG)算子的边缘零交叉二值化方法,该方法能够适应光照不均和噪声等干扰,其二值化后的字符图像能够很好地保持本来形态。 在特征提取方面,本文提取了三种有效特征向量,分别为原始点阵向量、宏观特征、宏观特征和微观特征。通过分析研究,利用三种不同特征向量进行字符分类,分类结果具有很好的互补性。 分类识别器采用了BP神经网络。对BP神经网络的训练算法进行了研究,提出一种综合优化训练算法,使网络训练速度得到提高,网络收敛也得以保证。将三种不同特征向量作为神经网络的输入,设计了三个不同网络结构的神经网络分类器,并提出动态权值的多分类器集成方法对三个分类器进行系统集成,提高了系统的性能和识别精度。 识别系统对自主采集建立的手写体数字图像库(SHNID)和美国邮政管理局(USPS)手写体数字图像库分别进行了三单分类器和动态权值集成测试实验,单分类器最好识别率分别为98.686%和91.6791%,采用动态权值集成方法集成后的识别率分别达到了98.9152%和92.1774%。实验结果表明该系统对手写数字具有较高的识别率。
其他文献
本文的研究内容主要以双站合成孔径雷达的成像算法为主。主要建立了双站合成孔径雷达的信号模型,提出了双站SAR成像算法的主要难点,对不同工作模式下的成像算法作了深入研究。
学位
近年来,包括多媒体业务、高速宽带业务等在内的无线网络数据业务发展迅猛,这些应用需要网络具有低时延,高吞吐量,高带宽等特点。传统的单信道网络中由于通信节点配备的是半双
随着计算机技术、压缩技术以及网络技术的发展,网络中的流媒体业务也得到了飞速的发展和应用。与传统IP数据业务相比,视频流媒体需消耗更多网络带宽,而且希望网络具有面向连接的
近年来,随着互联网的日益普及和无线通信技术的飞速发展,IP网络开始承载更加丰富的网络服务,许多实时应用对互联网的服务质量提出更高的要求。传输层在互联网的协议栈中处于
无线传感器网络是通信领域中的重要课题,构建适用于国内通信标准的硬件平台与软件系统具有非凡的意义。然而,目前在国内研究阶段所采用的节点有着计算能力有限、通信性能不佳、