复杂背景下证件识别技术的研究与实现

来源 :电子科技大学 | 被引量 : 15次 | 上传用户:dustfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来和办公智能化的普及,愈来愈多的政府单位,银行,民营企业希望图片证件信息的录入可以自动化,这样不单能节省大量人力成本,还可以提高客户办理业务的效率,尤其是在远程办公方面,通过客户上载图像就能自动录入图像中信息的功能可以极大的增强客户的使用体验,提高办公效率。对图片的证件信息识别和录入通常都是基于光学字符识别(OCR)技术,不过具体的识别流程繁杂,涉及到多种技术,且有诸多弊端。本课题在调研国内外OCR识别技术研究现状的基础上提出了一套基于深度学习技术的证件识别通用框架,该框架可面向复杂背景下的图片并进行识别。文章最后以身份证作为样例对该框架进行了识别验证和展示。本论文对复杂背景下证件识别使用到的方法进行了详细阐述,概括起来主要包括:证件检测,证件字符切割,证件字符识别:(1)证件检测是指在复杂的背景图像中将证件检测出来。该过程最为繁琐,为了有效地在繁杂多样的背景中将证件检测出来,首先要对原始图像使用高斯模糊和灰度化进行预处理操作,接着使用多种算子来扫描证件边缘,然后使用训练好的SVM分类器对检测出的轮廓图像进行识别,最后在对识别出来的证件图像进行倾斜矫正工作。(2)证件字符切割包括字符区域检测和字符切分。不同的证件的字符区域位置不同,证件本身的背景也各不相同,为了使字符区域检测的方法更具通用性,本文使用了自编码器对证件图像进行特征提取,并对提取到的特征分类训练以此将证件中的文字区域检测出来,该方法可以针对各类证件的文字区域检测;字符区域检测出来之后,使用了改进的垂直投影法对字符进行切分,提高了对汉字字符切分的准确率。(3)证件字符识别方面我们提出了一个基于深度神经网络的字符识别网络,该网络实现了中、西文以及数字混合识别,识别正确率较高。通过理论及实验证明,该框架可以对具有复杂背景的图片进行证件信息识别且识别效果良好,若将应用到相应需求单位可以极大的减轻单位人工劳作且帮助实现远程办公。
其他文献
中国黄土分布广,厚度大,是古气候变化的良好记录载体,然而黄土在大气CO2循环中到底是源还是汇一直是困扰人们的一个问题,本文利用陆相生态系统中的生物地球化学模型,通过敏感性试
在信贷市场完全信息的假设下,以贷款风险溢价为基础计提的贷款损失准备金能够完全覆盖贷款预期损失。而在经济或行业处于繁荣或上升时期,银行扩张贷款总量、增加长期贷款、放
以面向服务的设计为理念,基于IFC标准和三维地理空间信息平台的集成应用思想和技术方法进行数字化平台架构设计,构建基于B/S网络架构的3DGIS+BIM数字化电力设施信息平台。该
昌平兄的主要精力都用在出版工作上,自己的学术研究则依靠下班回家以后到半夜这段时间。这种工作习惯严重损害了他的健康,加上抽烟太多,很早就患有冠心病。尽管如此,他一直没有放
报纸
<正>俾斯麦是一个建筑师,深知帝国大厦的稳固在于底层的坚实。面对波澜壮阔的工人运动,俾斯麦明白如果放任容克和大资本家们压榨工人,那么帝国的根基岌岌可危。一些开明的企
新的行政诉讼法及司法解释的出台对规范性文件的司法审查做出了重要的突破和尝试,但也给实践带来了一系列的烦恼。新的司法解释采取回避态度,没有对使该项制度有效运行的程序
大数据时代的到来促使各个领域都开始因庞大的数据资源而发生变革,社会保障领域也不例外。近些年中国社会保障制度不断扩面,参保人数激增,使得越来越多的人开始关注相关机构
近日,记者从国家工商行政管理总局获悉,“慕思dR de RUC-CI”注册商标被认定为“中国驰名商标”,据介绍,这是慕思继去年获“广东省著名商标”、“GIA全球家居创新大奖”等国际国
报纸
<正>不知从何时起,城市中"晚育族"群体越来越壮大,很多人一晃就过了30岁的生育年龄"警戒线",高龄产妇增多,已成为中国乃至全世界的普遍现象。日前,一项对7768人进行调查显示,