论文部分内容阅读
随着信息时代的到来和办公智能化的普及,愈来愈多的政府单位,银行,民营企业希望图片证件信息的录入可以自动化,这样不单能节省大量人力成本,还可以提高客户办理业务的效率,尤其是在远程办公方面,通过客户上载图像就能自动录入图像中信息的功能可以极大的增强客户的使用体验,提高办公效率。对图片的证件信息识别和录入通常都是基于光学字符识别(OCR)技术,不过具体的识别流程繁杂,涉及到多种技术,且有诸多弊端。本课题在调研国内外OCR识别技术研究现状的基础上提出了一套基于深度学习技术的证件识别通用框架,该框架可面向复杂背景下的图片并进行识别。文章最后以身份证作为样例对该框架进行了识别验证和展示。本论文对复杂背景下证件识别使用到的方法进行了详细阐述,概括起来主要包括:证件检测,证件字符切割,证件字符识别:(1)证件检测是指在复杂的背景图像中将证件检测出来。该过程最为繁琐,为了有效地在繁杂多样的背景中将证件检测出来,首先要对原始图像使用高斯模糊和灰度化进行预处理操作,接着使用多种算子来扫描证件边缘,然后使用训练好的SVM分类器对检测出的轮廓图像进行识别,最后在对识别出来的证件图像进行倾斜矫正工作。(2)证件字符切割包括字符区域检测和字符切分。不同的证件的字符区域位置不同,证件本身的背景也各不相同,为了使字符区域检测的方法更具通用性,本文使用了自编码器对证件图像进行特征提取,并对提取到的特征分类训练以此将证件中的文字区域检测出来,该方法可以针对各类证件的文字区域检测;字符区域检测出来之后,使用了改进的垂直投影法对字符进行切分,提高了对汉字字符切分的准确率。(3)证件字符识别方面我们提出了一个基于深度神经网络的字符识别网络,该网络实现了中、西文以及数字混合识别,识别正确率较高。通过理论及实验证明,该框架可以对具有复杂背景的图片进行证件信息识别且识别效果良好,若将应用到相应需求单位可以极大的减轻单位人工劳作且帮助实现远程办公。