离线手写体汉字鉴别及识别算法研究

被引量 : 4次 | 上传用户:wodetiantian3321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着模式识别技术的发展,手写汉字笔迹鉴别和字符识别的研究越来越引起人们的重视。汉字字符有其自身的特点:字符种类多,字形复杂,而手写字符又存在书写风格各异的问题。为了满足应用的需求,深入的研究手写汉字笔迹鉴别和字符识别具有广泛的应用价值。本文的主要研究内容和学术贡献有以下几个方面:首先,针对目前采集到的笔迹图像样本的背景、噪声、大小不一等问题,本文设计了一套笔迹图像预处理系统。该方法对于影响图像样本的格线等背景,设计了阈值分割方法进行背景去除;为体现手写字符的书写风格,进行了灰度化和二值化的处理;通过实验比较验证了手写汉字图像的各种去噪方法,选取自适应中值滤波方法对图像进行去噪;最后针对字符或纹理图像样本大小各异的问题,设计了行、字分割和尺寸归一化。整个预处理系统为后续的特征提取效果提供了保证。其次,在文本依存的离线手写汉字笔迹鉴别问题上,提出采用各项异性高斯滤波器对样本进行特征提取的方法,通过实验分析了尺度和角度参数对于特征值的重要性。针对滤波器参数选择耗时过高的问题,提出了结合人工蜂群算法和LDA算法的参数优化方法。实验证明,该参数优化方法可以大幅提高鉴别的时间效率。对于基于文本独立的离线手写汉字笔迹鉴别,针对目前算法存在识别率不高的问题,提出一种特征融合的方法进行笔迹特征的提取。该方法结合了局部二值模式方法的局部特征提取能力强,和多通道分解方法全局特征提取效果好的优点,同时在空域和时域上进行特征提取,应用于文本独立的笔迹鉴别中,取得了不错的识别率。最后本文研究了手写汉字字符识别问题,由于传统的算法在特征提取的过程中容易丢失特征信息,进而导致分类识别率下降,首次选用直接从基本像素入手进行特征提取的卷积神经网络,进行汉字字符识别。这种方法可以同时进行特征提取和分类,减少了中间的环节,有效控制了信息丢失的问题,实验结果证明,本算法在手写汉字字符上可以取得很好的效果。
其他文献
以我国2009~2013年52家上市高端装备制造企业为样本,运用DSBM模型测算企业效率得分,并使用随机面板Tobit模型检验风险投资与智力资本对企业效率的改善效应。研究发现:高端装
国内上市动因研究文献大多为定性的对上市制度的考察,本文试图通过定性和定量分析中国概念股样本的特征,依靠大量数据支持通过40余张图表对其上市动因进行研究。进行的工作包括
分别从稀释液配制用水的选择、稀释液处理条件的选择、精液保存条件的选择这三个方面入手,来确定化验室常规操作中影响公猪精液品质的最适宜外在因素。三项外因均呈明显的对
政府开发援助(ODA)是国家对外援助的主要方式,也是经济外交的主要手段,能够反映出一个国家的外交政策取向。而日本作为一个十分重视经济外交的国家,对ODA政策的研究也就成为了理解
我国近几年面临大规模城市化、土地加速开发和高强度开发等局面,为了实现城市化的可持续发展,满足丰富的城市生活需求,城市综合体作为一种高效利用土地资源、功能高度集成的城市
目的富血小板血浆(platelet-rich plasma,PRP)含有丰富的生长因子,对多种组织具有再生和修复作用。通过构建含PRP的纳米纤维支架,实现生长因子的缓释效果,并研究其对软骨再生的作用
唐诗是中国古典诗歌的艺术高峰。从一般研究成果来看,学者们都偏向于研究唐诗是触景生情、抒发胸臆的文学作品。其实在很多唐诗中都蕴含着丰富的科学技术,这是与唐代诗歌和科技
本文以歌德的植物学论文《植物变形记》和同名诗歌为例,采用将两个相关文本进行互文性对照的主要研究方法,以歌德的植物学研究为出发点,重点关注歌德的“叶子”理论,进而探究同名
在回顾相关理论的基础上,本文通过索洛余值、数据包络、随机前沿三种方法对新疆地区和新疆各地州的全要素生产率进行了测算,分析了新疆地区和新疆各地州全要素生产率的差距;还运
随着生活水平日益提高,人们对服装制造提出了高精度和高效率要求。使用数控服装裁剪机代替传统的人工裁剪是服装加工行业的必然趋势。目前,数控服装裁剪机的市场仍然被国外知名