论文部分内容阅读
随着信息化时代来临,网购成为了主要的购物渠道,快递业务迅速发展,快递运单逐渐从普通手写单据过渡到电子运单。目前国内的快递行业企业之间信息共享、互联互通尚不充分,部分末端仍然依靠人工录入投递相关信息,效率较低,人工成本较高。实现自动化识别电子运单关键信息,不但能提高末端投递效率,降低运营成本,也能实现地址信息统一化管理和快递业务优化。文本信息具有形状随机、没有边界的特性,使得传统图像处理的方式对于自然场景的图像文本信息识别相当困难。深度学习具有强大的特征提取能力,能自动地通过文本数据学习特征,进行文本信息的识别。本文基于深度学习的方法对电子运单关键信息进行识别。本文的工作主要包括:(1)调研并归纳总结了 OCR的研究现状及在各领域的应用,介绍了深度学习的发展和应用,并介绍了其原理和网络结构。(2)本文建立了基于CTPN网络的文本检测模型,该模型针对文本的特征,在Faster RCNN的基础上优化了候选框规则,利用多个小检测框连接的方式实现了对文本信息的检测,同时增加了循环神经网络学习序列特征。(3)在文本识别部分,基于CRNN网络,结合卷积神经网络和循环神经网络各自的优势,同时融入DenseNet网络的思想,建立了DenseNet+LSTM的CRNN文本识别模型。(4)基于卷积神经网络实现了方向预测网络,并将方向检测网络、文本检测网络、文本识别网络相结合,开发了一个电子运单识别系统,对电子运单关键信息的识别获得了较好的效果。本文开发的电子运单识别系统,对电子运单上的关键信息如电话、姓名等能进行较准确的识别,并且具有很好的鲁棒性和泛化性,对快递公司不同模板的电子运单都具有较好的识别效果,体现了深度学习方法的优越性,对提高快递物流末端分拣、投递效率具有重要的意义。