【摘 要】
:
手写文字识别技术已广泛应用于各类智能系统。粘接文字的分割是手写文字识别的第一步,因其分割难度之大,往往成为进一步识别甚至是整个智能系统的瓶颈,分割的好坏直接决定了识别
论文部分内容阅读
手写文字识别技术已广泛应用于各类智能系统。粘接文字的分割是手写文字识别的第一步,因其分割难度之大,往往成为进一步识别甚至是整个智能系统的瓶颈,分割的好坏直接决定了识别率的高低。通常,随着字符串个数的增加,粘连程度的增大,分割难度也在进一步加大。目前,多粘连字符串的分割与识别现在已成为手写文字识别系统研究的热点之一。
针对含有字符和数字的强粘连字符串的分割与识别问题,本文做了如下工作:
1.本文对初始灰度图片进行分割之前,采用了一种新的预处理方法,以求粘连字符串分成尽可能多的几个连通区域,然后采用本文提出的字符串上下轮廓提取方法,对预处理后的图片提取上下轮廓。得到上下轮廓后,利用KNN分类器找到候选的特征点,进而根据候选特征点构造出分割路径集合。
2.利用分治算法依次处理字符串图片的每个连通区域,然后对粘连字符部分使用基于识别反馈机制的字符分割算法,筛选出最优分割路径来完成分割和识别,再组合所有连通区域的识别结果得到最终的结果。此方法与以往算法相比,时间复杂度在一定程度上有所降低。
3.本文采用KNN和BP神经网络这两种分类器做单字符识别,最终选择识别率更高的BP神经网络用于识别反馈。
本文的创新点是:首先我们采用一种新的预处理方法来处理灰度图片,然后利用KNN分类器来提取轮廓特征点,随后采用了一种打分机制匹配上下轮廓特征点来构造分割路径集合。最后,我们将遗传算法和识别反馈结合起来完成字符分割与识别。
实验结果表明,本文提出的方法在解决强粘连多字符串的分割与识别方面取得了不错的效果,同时反馈机制的引入,也提高了识别的可靠度。
其他文献
互补问题(CP)是运筹学与计算数学的一个交叉研究领域,在数学规划、博弈论、力学和供应链管理等研究领域有着广泛的应用。R.W.Cottle[12]首次提出了“互补问题”,使得人们开始广
形式概念分析作为一种有效的数据分析工具,已经在许多领域得到了广泛的应用,如:机器学习、知识发现、信息检索、软件工程等等。概念格是形式概念分析理论中的核心数据结构,而
整群环理论是代数学的一个重要分支,它与同调代数、表示论、代数K-理论等其他分支有着深刻的联系,是一个基础性较强的研究领域。 记整群环ZG的增广理想的n次幂为△n(G)(称之
Markov链模型是独立随机试验模型最直接的推广,因早在1906年就对它进行研究的俄国数学家Markov而得名.20世纪中后期,Kolmogorov,Feller和Doob等数学家发展了这一理论.关于Markov过
在抽样调查中,无回答是经常遇到的也是比较难处理的问题之一,它的出现直接影响着估计的精度,调查中的无回答也一直是困扰调查统计工作者的一个问题.虽然国际统计界对无回答问
John von Neumann在1950年代提出的细胞自动机是一种时间、空间与状态都离散的数学模型.在型态表现上,每个细胞自动机都是一个离散型的动力系统.通过设计不同的局部规则,细胞
在过去三四十年里,Walrasian平衡点的存在的Arrow-Debreu结果已经在很多方面被推广。Mas-Colell首先认为平衡点的存在无需假定偏好是完备和可传递的,然后Gale和Mas-Colell证明
Bezier曲线是CAGD系统中最基本的造型工具之一。由于它采用一组独特的多项式基函数,使得它具有许多优良的性质。但是Bezier曲线段之间的拼接特别是二阶连续的拼接比较困难,而有
随着计算机的飞速发展和社会信息化程度的不断提高,信息是无处不在,信息的安全性问题也越来越受到人们的高度重视。在信息安全问题上,怎么产生形态优良的伪随机数至关重要,因为形
在实际中,许多系统的状态是部分可测或不完全可测,故构造观测器,并用估计状态实现反馈控制是一个非常有意义的研究工作.关于观测器的设计方法,目前已经有许多著作,然而,对于