【摘 要】
:
图像中的文字包含丰富的场景信息,对图像中的文字进行检测与识别是计算机理解图像的关键途径之一,因此,在图像理解、智能交通、无人驾驶等领域都需要对文字进行检测与识别。然而,传统的文字检测与识别主要面向文档图像,这些算法无法直接应用于现实生活中的复杂场景。基于当前文字检测与识别算法的不足,本文采取深度学习的方法,提出了针对复杂场景的中英文文字检测与识别算法。具体的研究内容包含以下几个方面:首先,本文提出
论文部分内容阅读
图像中的文字包含丰富的场景信息,对图像中的文字进行检测与识别是计算机理解图像的关键途径之一,因此,在图像理解、智能交通、无人驾驶等领域都需要对文字进行检测与识别。然而,传统的文字检测与识别主要面向文档图像,这些算法无法直接应用于现实生活中的复杂场景。基于当前文字检测与识别算法的不足,本文采取深度学习的方法,提出了针对复杂场景的中英文文字检测与识别算法。具体的研究内容包含以下几个方面:首先,本文提出了一种基于区域候选框的倾斜文字行检测算法。由于现有文字检测算法的不足,本文重新设计了一种能够检测倾斜文字行的算法。该算法基于卷积神经网络生成的文字区域候选框,用分类子网络的分类特征图对区域候选框进行分类,过滤属于背景区域的候选框,然后用角点回归子网络的位置特征图对剩余的区域候选框的四个角点进行位置回归,使候选框的位置回归到真实文字行的位置,得到最后的文字行检测结果。并且本文构建了一个大规模的中英文文字检测数据集,用于对文字行检测算法进行训练和测试。实验表明,本文的检测算法有优异的检测性能,能够检测出复杂场景中各种角度的倾斜文字行。然后,结合卷积神经网络和循环神经网络对文字行进行识别,并进行三个方面的改进。该算法利用卷积神经网络和循环神经网络进行特征序列的提取和预测。本文对网络重新设计并做了相应的改进,在用于特征提取的卷积神经网络中加入非对称卷积和特征复用,加强神经网络对图片中横向区域的特征提取能力以及更好地获取图像中的细节信息。接着本文在用于序列预测的循环神经网络中加入Attention机制,使得循环神经网络尽量接收与当前输出有关的特征向量作为输入,加强预测能力。此外,本文构建了一个包含中英文的文字识别数据集,用于识别网络的训练和预测。实验结果表明,本文改进后的识别算法有显著的效果,能够准确识别文字行。最后,基于本文提出的文字检测和识别算法,提出了复杂自然场景下进行文字检测和识别的整套流程,用于对自然场景中的图像同时进行文字行的检测和识别。同时本文设计了一款文字检测和识别的软件,可以方便快捷地对图像中的文字进行检测和识别。
其他文献
现如今创新已然成为我国经济发展的主要动力和主流模式,产品开发离不开创新,而顾客作为产品的直接体验者和使用者,其创新能力对于新产品开发而言往往具有决定性和关键性的贡献。随着顾客价值共创理论的不断发展,越来越多行业开始将顾客观点纳入产品开发创意库,奢侈品产品也同样不例外,但奢侈品受其行业特点的影响导致共创活动的结果并不尽如人意,这就对奢侈品共创战略布局提出了更高的要求:在奢侈品领域应用价值共创理论,探
随着经济一体化和科学技术的不断发展,资源整合、企业间的有效合作成为一种必然趋势。第四方物流通过整合第三方企业资源,提供完整的供应链解决方案,弥补了目前占我国主导模式的第三方物流在管理和运营上的不足。第四方物流配送路径优化问题的研究,对企业有效资源配置和节约成本非常关键。因此,第四方物流路径优化问题的研究有着重要的现实意义和应用背景。首先,本文研究了考虑客户风险偏好下的单供应商配送第四方物流路径优化
随着以法官员额制为代表的本轮司法改革逐步推进,如何从原有法官队伍中遴选出员额制法官成为改革的关键一环。遴选出符合改革目标、适合审判岗位的员额制法官,可以加快法官队伍正规化、专业化、职业化的建设进程,提高法官审判能力,实现裁判结果的公平公正,树立司法权威,并作为“牛鼻子”促进本轮司法改革的顺利开展,解决法官队伍鱼龙混杂、裁判不公、司法腐败等问题。更好地建设法官队伍,提升司法权威,对司法改革和法官队伍
激光雷达是智能汽车感知层最重要的一环,随着电动化智能化加速,行业具备较好的成长前景。原来缺点是贵且技术难点多,随着华为等巨头入局,成本和技术双双被攻克。2021年是激光雷达元年,累计有19款新车型配置该技术,明年或将加速放量,产业处于爆发前夕。激光雷达痛点被扫除感知作为智能汽车的眼睛,其探测精度、广度与速度直接影响行驶安全,目前主要有视觉及激光雷达两种方案,其中视觉方案所获数据与人眼感知的真实世界
采用DIL805A型淬火变形膨胀仪,利用膨胀法结合金相-硬度法,绘制了40CrMnSiB钢的连续冷却转变曲线(CCT曲线),研究了冷却速率对组织和硬度的影响规律。结果表明:在试验条件下,40CrMnSiB钢相变温度Ac1为770℃,Ac3为823℃,Ms为322℃,Mf为176℃;随冷却速度增加,组织由软相铁素体+珠光体变为贝氏体和马氏体,显微硬度也逐渐提高。40CrMnSiB钢淬透性较高,当冷速
众筹,作为一种新型的互联网融资渠道,为有创新想法的个人或企业提供了一种新的开放式的融资途径。2009年成立的Kickstarter,现已发展成为世界上最大的产品众筹网站,极大地促进了众筹的发展,对众多众筹平台的机制设计具有重要的借鉴意义。产品众筹网站大多采用“All or Nothing”的筹资机制,除非在事先预定的时间内达到筹资目标,否则众筹项目所筹资金将原路返还给消费者。影响众筹绩效的因素有众
本刊讯:2022年5月10日,仁怀发布“中国酱香白酒核心产区(贵州·仁怀)”图识,该图识是“核心产区”的有效“身份证”和酱香白酒行业入门“通行证”。据介绍,该图识主要用于证明仁怀酱香型白酒的原产地域和特定品质,强化“核心产区”地域保护,提升“核心产区”的品牌知名度和影响力,保护使用者和消费者的合法权益。为此,仁怀市同步制定了《中国酱香白酒核心产区(仁怀)及图使用办法》。
治国安邦,重在基础;管党治党,重在基层。党的基层干部队伍建设是基层党建工作的重要组成部分和关键环节,在基层党组织建设中发挥不可代替的作用。锦州市凌河区作为锦州市的五大主城区之一,在党的基层干部队伍建设中与党中央、省委、市委保持高度一致,取得了一定的成绩。在党的基层干部队伍建设发展进程中,凌河区也出现了共性问题和个性问题。通过对凌河区街道和社区开展的调研,对凌河区基层干部队伍建设有了更加深刻清晰的认
一直以来,小微企业是我国经济发展过程中不可或缺的重要部分,它的发展解决了如居民就业、产业平衡和促进市场发展等问题。小微企业具有效率高、成本低、方式灵活等特点,但也存在规模小、融资难、抗风险能力差等问题。近年来,我国实施的小微企业税收优惠政策,既缓解了小微企业税负,也促进了小微企业发展。但是,在政策执行的过程中,仍存在一些问题需要研究解决。本文以沈阳市D区小微企业为研究对象,通过对辖区税收优惠政策的