论文部分内容阅读
图像字符识别是图像处理与模式识别理论的一个重要应用领域,是实现智能人机接口的重要途径;近几十年来得到广泛的研究。字符识别是模式识别的一个重要方面,在信息处理,办公自动化,邮政系统,银行系统等方面有着重要的使用价值和理论意义。目前文字识别技术已相对成熟,但是对粘连字符识别错误率还比较高。一般认为主要原因是粘连字符的错误切分而导致字符的严重失真变形,无法正确的识别,因此粘连字符的切分成为提高识别率的关键技术。现有的切分方法主要有:(1)基于图像分析的直接切分法,通过图像分析寻找字符之间较为合理的切分点,但切分错误率比较高;(2)基于识别的切分法,先通过图像分析,确定几个可能的切分点,借助识别结果,选择合理的切分点。后者切分方法的识别比较高,但是多次识别,步骤繁琐,比较耗时。为了提高粘连字符识别率与识别速度,本文的研究与创新点可分为两大部分:一是在第二代身份证识别算法方面,包括三点:(1)适合第二代身份证的感兴趣区域提取的分割方法,实现文字区域的定位和分割,将真正的文字图形从身份证复杂的背景中分割出来。运用一定的识别原理,对文字进行分类,确定其属性;(2)第二代身份证的字符切分方法,降低切分字符的粘连率,针对污点、褪色、光照不均匀和分辨率过低对检测区域的字符粘连影响采用了上下轮廓凹凸特征近似检测单个字符的宽度,在字符宽度的约束下,根据轮廓凹凸特征,直接建立切分路径,提高文字字符的识别正确率;(3)针对第二代身份证图像字符识别,提出了一种基于字符串轮廓检测的方法。该方法采用对图像字符区域特征提取后,获取字符区域后对其上下轮廓凹凸特征近似检测单个字符的宽度,从中选出稳定的局部特征,利用结构语句识别的方法进行字符识别。二是设计实现第二代身份证识别系统软件原型,字符识别系统主要分三个部分:(1)预处理模块:这个模块不仅包含了本文所采用的算法先对图像进行灰度拉伸,在灰度拉伸的基础上对图像采用空间域法进行图像的滤波。而且还包含了本文第三章所采用的对图像进行字符区域分割。(2)特征提取模块:采用上下轮廓凹凸特征近似检测单个字符的宽度,在字符宽度的约束下,根据轮廓凹凸特征,对字符进行特征的提取。(3)字符识别模块:采用字符轮廓结构特征和统计特征相结合的方法,并将字符库中的字符分为纹理图和非纹理图,然后分别对纹理图和非纹理图采用区域匹配,达到匹配的目的。