脱机手写体汉字识别系统

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:auzjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别是模式识别领域一个极具挑战性的课题,它将在信函分拣、银行支票识别、统计报表处理以及手写文稿的自动输入等诸多方面发挥巨大的作用。本系统的主要应用方向为手写文稿的自动录入,主要工作如下:1、预处理方面,采用3×3加权掩膜对汉字图像进行线性平滑;针对不同纸张背景制定了区别对待的图像二值化策略:对以空白纸张为背景的汉字图像采用迭代最佳分割阈值算法,以稿纸为背景的汉字图像采用双重阈值法;对经过切分以后的汉字采用线性归一化进行单字的大小统一。2、回顾和总结了历年手写体汉字的主要细化方法,提出了一种新的基于边缘剥离的手写体汉字细化算法。3、结合本系统主要适用于汉字文稿的整篇录入,采用了手写体汉字的系统切分算法,从行切分到字切分,特别在字切分这个较复杂的处理步骤中,提出了一种新的基于笔段提取的结构分析切分算法,能够很好的解决汉字粘连和重叠的问题。4、介绍了几种主要的统计特征和笔划结构特征提取方法;采用重叠动态网格方向特征提取法为统计特征提取手段,改进了基于细化的笔划特征提取法为结构特征提取手段,综合应用于本系统的特征提取。5、在识别阶段,采用了改进的双层串行分类器结构,将识别时间缩短了约30%。本系统中训练和测试样本共包含一级汉字和二级汉字约3000个,每个汉字有4种不同风格。将训练样本分为两类:第一类为手写印刷体汉字,笔划疏散且基本横平竖直;第二类工整普通汉字书写有少量连笔,字形尽量规整。分别采用两种不同识别方法后得到第一类汉字识别正确率为91%,第二类汉字为86%。
其他文献
近年来,随着图像传感器技术的发展,图像融合在机器视觉、医疗诊断、遥感影像分析等各个领域都得到了广泛的应用与发展,其融合算法也是近年来中外学者研究的热点与难点。针对传统
随着社会的快速发展,英语作为重要的信息载体,已经成为人类生活各个方面广泛使用的语言,堪称“国际语言”。在我国,英语作为一门外语是学校的必修课程,也是学生需要掌握的外语技能
覆盖控制作为无线传感器网络(WSN)中的一个基本问题,反映了网络所能提供的“感知”服务质量,可以使无线传感器网络的空间资源得到优化分配,进而更好地完成环境感知、信息获取
矿井瞬变电磁法是在井下巷道有限空间内进行的一种常用矿井地下水勘探方法。近几年,矿井瞬变电磁法获得了广泛应用,给我国带来了巨大地经济和社会效益。但在井下复杂地质条件下
信息技术的巨大发展对军事领域的作战理论等产生巨大的影响,现代以网络为中心的战争的焦点主要集中在信息的争夺上,这要求整个作战系统能够在短时间内完成信息的提取处理及分
在工业现场控制领域中,数据大部分采用有线的方式进行传输,一些恶劣的工业现场环境中有线电缆易受损坏而无法适应,无线Wi-Fi技术因具有数据传输速度快、无需布线且组网灵活等特
合成孔径雷达(SAR)成像不受气候、昼夜等因素的影响,具有全天候、全天时的优点,在军事和民用领域有广泛的应用价值。高效成像算法是SAR成像的关键和基础。本论文在介绍SAR成
计算机网络的快速发展给人们的生活带来了极大的方便,同时也带了日益严重的网络安全问题。作为保证网络信息安全传输的重要手段之一,网络隐蔽信道受到了越来越多的关注。网络隐
本文基于DSP,在“双环结构马赫-泽德干涉仪的光纤振动传感系统”项目中,针对系统信号处理终端,进行实时数据采集和处理研究。本文首先从光纤振动传感系统的振动定位原理出发,
随着人类社会信息化的加剧,视频通信的应用成为必然趋势,但是视频信息量巨大,难以传输和存储,此时,就需要通过运动补偿、DCT变换等方法对视频进行压缩,而压缩后的视频码流在