【摘 要】
:
目前,OCR(Optical character recognition,光学字符识别)技术对印刷体汉字的识别已经达到实用效果,但是,对脱机手写汉字的处理却很难满足实际需求,手写汉字的形变是造成这一
论文部分内容阅读
目前,OCR(Optical character recognition,光学字符识别)技术对印刷体汉字的识别已经达到实用效果,但是,对脱机手写汉字的处理却很难满足实际需求,手写汉字的形变是造成这一状况的主要原因。鉴于单一的统计特征提取手段和简单的分类算法很难适应脱机手写汉字字形的变化,本文利用汉字笔画结构作为识别特征,选用以笔画组合距离为判定标准的模板匹配方法对脱机手写汉字进行识别。本系统主要分为笔画特征提取和笔画结构特征匹配两个阶段。在汉字笔画结构特征提取阶段,首先将汉字细化,得到其骨架结构;再利用像素点的度的概念,去掉交叉点,并通过最大距离法获取拐点位置;然后以获取的特征点信息为依据提取笔段,并对其进行优化,消除干扰特征;最后根据笔段间的相似矩阵,将在原汉字图像中本应该相连的笔段合并为笔画,提取汉字笔画的端点坐标和笔画数作为笔画结构特征。在之后的笔画结构特征匹配阶段,利用笔画的结构特征作为模板,将待识别汉字的所有笔画与字典匹配,计算出待识别汉字与字典中每一个汉字的组合距离,选取其中最小的距离进行分类识别。通过对脱机手写汉字样本的识别实验,该方法是行之有效的。
其他文献
随着数字化的时代的来临,各种媒体机构正在由传统的模拟信号方式转变为数字化处理方式。MPEG-2图像压缩标准适用于高质量数字视频压缩,在HDTV、SDTV和DVD等标准中有着重要的
互联网的迅速发展已使其成为人类日常生活中必不可少的组成部分。然而,扫描、DDoS攻击等各种安全威胁产生的大量非授权流量(Unwanted Traffic)严重影响着网络的稳定、性能和
针对现有的交流变频调速电牵引采煤机和电磁调速电牵引采煤机在使用过程中存在的不足,提出了采用高性能、高可靠的开关磁阻电机调速系统(Switch Reluctance Drive,简称SRD)作
网格(Grid)是一种在互联网的基础上新兴发展的分布式计算结构,其根本目的是协调资源的共享,而实现资源共享的前提是网格资源发现,它为网格资源调度寻找满足应用需求的各种资
近年来,面向对象的开发方法成为大型应用系统开发环境中的主流开发方法,关系数据库成为大型应用系统开发环境中的主流数据存储系统。数据在软件开发过程中表现为对象,而在关
无线信道环境的复杂性、时变性以及传播路径的多样性决定了信号在无线信道中传输必然存在多径传播现象,而由多径传播造成的信道衰落(即多径衰落)是提高数据传输速率和服务质量的
随着网络硬件设备和系统节点价格的不断下降,带有通信网络的闭环控制系统的应用越来越普遍。网络控制系统有非常广泛的应用前景。由于带宽限制和网络堵塞,通信网络不可避免的
人脸识别是模式识别领域中具有广阔应用前景的课题之一,它是一种基于图像信息处理的模式识别系统。随着社会的发展,科学的进步,人们对于身份鉴别的准确性、安全性与实用性也
随着计算机网络的规模和应用范围的不断扩大,能够快速传染的网络蠕虫给计算机网络安全防护工作带来极大的挑战。现有的安全防御工具如入侵检测系统等大多都是采用基于误用的
近年来,在弱监督信息下进行学习已成为机器学习的研究热点,偏标记学习是其中一类重要的弱监督学习框架。在该框架下,训练集中的每个对象对应于输出空间的一个候选标记集合,并