基于深度学习的文本识别算法的研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hhh491371886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据和人工智能技术的迅速发展,计算机视觉领域得到了越来越多的关注;作为计算机视觉领域下的重要分支,文本识别方向更是如此。高性能计算平台的发展和大规模数据集的出现使得基于深度学习的文本识别算法在该领域下取得重大突破,但是,众多的算法模型却拥有不同的应用场景,各算法模型的场景通用性普遍较弱。文本识别任务中,算法模型特征与图像文本特征的匹配度对识别效果的准确性和鲁棒性起着决定性的作用。当前,少有研究针对多种文本识别技术在不同场景下的适用性而展开,从而限制了文本识别技术在综合应用系统中的使用,比如智能交通系统、自动驾驶等。本文是以探讨各文本识别技术解决方案的场景适用性为目的,对各文本识别算法进行研究,主要工作和贡献如下:1.深入研究基于深度学习的文本识别算法,对目前主流文本识别技术解决方案下的各算法模型进行分析,涵盖网络结构对比、文本识别过程等多个方面。2.对目前文本识别技术主要应用场景下的图像文本特征进行分析总结,并设计制作了两种涵盖多类不同文本特征的应用场景作为研究数据集,通过多组对比实验对各算法模型的场景适用性进行了研究和分析。3.基于以上各算法模型场景适用性的实验结论,通过设计增加场景分类网络对输入图像进行分类,对不同场景下的输入选用对应的文本识别算法,实现了一个通用的文本识别系统。经过测试,所设计系统在两种实验数据集上的准确率提升都在5%以上。4.本文从工程角度对该文本识别系统进行解耦,实现了新场景下文本识别任务的快速接入,提高了该系统的可扩展性。
其他文献
目的:通过糖尿病动物模型,从新型委陵菜黄酮衍生物中筛选具有抗糖尿病活性的候选化合物。观察抗糖尿病候选化合物对2型糖尿病动物模型的降血糖作用,并从改善胰岛素抵抗,调节
目的:探讨两位阅片者采用前列腺影像报告和数据系统第一版(prostate image-report and data system version 1,PI-RADS v1)与第二版(PI-RADS v2)对前列腺临床显著癌进行诊断
铜锌锡硫系太阳能薄膜电池是基于Cu(In,Ga)Se2(CIGS)薄膜太阳电池而衍生出的一类新的半导体光伏器件。目前多数的研究都借助于真空或是非真空的途径来制备铜锌锡硫薄膜并组装
目的:随着人类社会老龄化,脑部疾患的发病率逐年上升。血脑屏障的存在阻碍了药物进入脑内,严重影响了脑部疾病的治疗效果。本项目以PEG-PLGA为载体制备纳米粒(NPs),以脑内皮
在Android应用程序中,密码学API主要用于处理与用户隐私相关的重要数据,正确使用此类API对应用程序开发者至关重要。然而,由于开发者缺乏密码学领域知识或对具体密码学API的使用方法理解不充分,Android应用程序中的密码学API误用现象频发,导致用户隐私数据面临极大风险。现有的Android应用程序密码学API误用检测方案通常根据预先定义的误用规则,对误用行为进行静态分析,并对具体误用进行
目的:臂丛神经根性撕脱伤是一种严重的外周神经损伤,会造成上肢功能的严重受损,健侧颈7移位术为患者带来了希望,为了进一步提高手术疗效,需要攻克的一个难题是切断颈7神经后造成的脊髓中枢神经元的逆行性退变(Neuronal Retrograde Degeneration,NRD)。在众多中枢神经系统退变的疾病中,均有Tau蛋白的异常磷酸化发生,而外周神经损伤后的中枢神经逆行性退变的发生过程中是否有Tau
随着世界人口以及发展中国家经济水平的增长,国民收入不断提高,乳制品市场不断扩大,预计到2020年,国际乳制品市场的需求将达到相当规模。近年,以农业为主的低收入国家越南的经济水平突飞猛进,建立在历史悠久农业基础的越南乳制品行业成为越南各个食品产业中增长最快、最具稳定性和利润最高的行业。以乳制品公司Vinamilk(下简称VNM)为代表的越南乳制品行业的龙头企业,通过进军中国市场等海外市场,2017年
物联网标识作为沟通海量设备和丰富应用的有机桥梁,是实现物联网协同感知和资源共享的重要基础设施。然而,随着物联网产业规模的不断扩大,异构设备跨域通信的需求逐渐增多,对物联网标识解析技术提出了挑战。现有标识体系存在编码规则不兼容,解析系统稳定性不高、安全性不强等问题,无法满足物联网泛在互联和信息融合的发展要求。区块链技术作为一种分布式多中心的可信存储框架,在去中心化、共识信任、数据安全可信等方面具有优
一直以来,中药材的质量问题都是科研研究的热点问题,而常用的中药材丹参(Salvia miltiorrhiza Bge.)质量问题的核心内容是丹参的道地性问题,要从根本上解决丹参的质量问题,解
与传统的相控阵(Phased Array,PA)相比,线性频控阵(Frequency Diverse Array,FDA)波束的能量分布不仅与角度有关,同时与距离也有关,从而形成了距离和角度双重依赖的波束方向图。因此,拥有较高自由度的FDA雷达在目标识别等方面有较大潜力。但是线性FDA波束在距离上具有周期性,容易受到潜在干扰的影响。非线性FDA打破了其周期性,在目标位置形成不规则的波束,并且能量一