脱机手写体汉字识别研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:lmx1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字是历史悠久的中华民族文化的结晶,闪烁着中国人民智慧的光芒。随着科学技术的不断进步和信息时代的不断发展,汉字在世界上已经有越来越多的使用人口,因此计算机自动汉字识别在模式识别领域也越来越受到研究人员的关注。汉字识别一般分为印刷体汉字识别和手写体汉字识别两类。到目前为止,印刷体汉字识别已经实用化,并且向更高性能、更完善的用户界面方向发展。而手写体汉字识别,特别是自由手写体汉字识别一直是模式识别研究领域中的难点,还处于实验室阶段。本文就自由手写体汉字识别过程中的特征选择、特征提取进行了探索性研究。特征选择是模式识别中处理原始特征的一种重要技术。其目的是去掉无用、不相关或冗余的特征。本文对特征选择算法FOS进行了改进,提出了一种新的特征选择算法MFOS。改进后的算法所选择的特征能更准确地代表模式。该算法提取了模式中的重要特征信息,同时减少了特征之间的相关性,能有效地对模式进行分类。特征提取是汉字识别过程中的关键环节。近20多年来,中外学者已经做了大量的研究工作,提出了许多不同的特征提取方法。这些特征主要分成两大类:统计特征和结构特征。其中统计特征抽取包括抽取文字背景轮廓特征、笔画方向特征等,结构特征的抽取主要是基于特征点、笔段、笔画等。针对手写体汉字识别过程中的特征提取,本文提出了一种新的抽取笔画平面的方法。对每幅经过规范化后的图像进行笔画平面提取,优越性主要在于能够根据单个汉字的汉字点阵每一条横向、竖向以及斜向扫描线(撇捺笔画平面)上的黑像素数目决定是否抽取该扫描线上的黑像素点,抓住了每幅汉字图像的一些细微信息。理论分析和实验结果表明这种算法是有效的。基于笔画平面抽取和动态网格划分,本文提出一种笔画平面与模糊隶属度相结合的手写体汉字特征提取方法。考虑到重叠动态网格可以克服对于笔画位移和局部变形的敏感性,用模糊隶属度表示网格中的每个点构成汉字图像的重要程度。首先用动态网格将汉字图像分别划分成横、竖、撇、捺四个笔画平面,然后赋予每个网格中的点模糊隶属度,针对每个网格求加权累积直方图,最终获得汉字特征。该方法克服了汉字特征抽取过程中因笔画粗细不均、笔画长短变形等引起的特征抽取不稳定问题。实验结果表明这种汉字特征抽取方法是有效的。
其他文献
随着信息技术的迅速发展,计算机游戏已经成为现代社会比较普遍的数字娱乐方式。传统游戏在给人们带来娱乐的同时,也招致一些批评,主要因为人们很容易沉迷其中,不利于身心健康
本文对GUI进行了面向测试的建模,该模型在概念上高度抽象,全面准确的描述了GUI的各种特性,适用于广泛的应用程序,为后续的设计提供了有力的理论基础。 目前,GUI自动化测试工具
近年来随着VOD系统的不断发展成熟,VOD用户数量不断增加,而相对来说,计算机系统硬件发展较为缓慢,VOD系统的设计面临着不断提高的服务器负载的问题。集中式单服务器VOD系统已经远
WebGIS是GIS技术与Web技术集成的产物,它具有信息共享方便、访问范围广、扩展空间大、平衡高效的计算负载、维护及升级方便等特点,这使得在人防信息化建设中充分利用GIS技术成
随着Internet技术与数字技术的飞速发展,数字媒体已成为人们获得知识的主要方式,与此同时,也产生了许多负面的问题,比如作品非法复制与传播等侵权行为。当前应用于图像、视频
基于内容的视频对象分割是数字视频技术乃至计算机视觉领域的一个研究热点。从视频序列中分割出视频对象对于第二代编码标准而言是一个非常重要的步骤,是基于内容的视频应用
基于视频图像的运动车辆目标实时精确定位,目标的识别、分类及跟踪在交通管理系统中有着非常广泛的应用前景。阴影检测是运动车辆目标识别与追踪中非常重要的环节。图像背景
基于字幕的视频检索是基于内容的视频检索的重要方面,利用新闻字幕进行检索可以大大降低视频检索的复杂度,提高视频检索的速度和准确性,对基于字幕的视频检索技术的研究具有
面对高维、非线性、非结构化的数据,如何从这些数据中找到蕴藏的规律是目前迫切需要解决的问题。流形学习是一种面向这样高维非线性数据的降维方法,它通过找到高维空间中的低
P2P网络提供了一种开放的、自由进行文件交换和资源共享的环境,在P2P技术的推动下,互联网的存储模式将由现在的“中心化”模式向“边缘化”模式发展。同时,P2P网络的节点来自