论文部分内容阅读
身份证作为持有人身份认证最重要的证件,在电信、银行、证券、公安、移动等各种行业都有着广泛的应用。随着信息技术的发展,各行各业相继迈进了数字信息化时代,为了提高各行各业信息化水平,身份证自动验证成为迫切的需要。因此如何利用图像处理和字符识别技术完整、高效的自动识别身份证个人信息并进行相应的管理和验证有着重要的意义。基于特征点的图像匹配方法步骤为特征提取、特征描述和特征匹配。本文中选取BOW(Bag of Words,词袋)模型表示字符图像。通过均匀网格特征、LBP(Local Binary Pattern,局部二值模式)特征和HOG(Histogram of Oriented Gradient,方向梯度直方图)特征等算法提取不同字符图像中的视觉词汇向量;K-Means聚类算法合并词义相近的视觉词汇,构造一个包含有多个词汇的编码码本;使用SPM(Spatial Pyramid Matching,空间金字塔匹配)将字符图像划分为多个不同分辨率的细网格,从每个网格中提取特征,并把它们连接成一个大特征向量,使用词库中的词汇表示字符图像,得到该字符的特征编码;通过相似性距离计算待识别字符图像特征编码与词库中字符图像特征编码之间的距离,距离最小的字符图像即匹配结果。相比一般基于特征点的图像匹配方法,本文中算法对于汉字字符识别率更高。身份证字符识别软件使用C++语言结合MFC编写,vs2010作为开发环境,以64位win7系统作为运行环境。软件功能模块主要有:图像预处理作为身份证字符识别的第一步,对身份证图像进行灰度化、二值化和版块分割;字符切分得到单个字符的字符图像,并预识别地址栏信息中可能包含的数字或字母;归一化待识别字符图像使得和字库中字符图像大小一致;字符识别得到身份证各栏信息识别结果;识别后校验,比对识别结果和身份证芯片信息鉴别身份证的真伪。本文中身份证字符识别软件通过识别身份证采图仪得到的证件图像,能够按照身份证个人信息含义,进行分割,字符识别。能够完整,快速,有效的识别身份证持有人信息,并通过对比身份证识读器读取证件内嵌的射频信息,实现鉴别身份证证件的真伪。