【摘 要】
:
自然场景图像中的文本蕴含关键的高层语义信息,识别出其中的文本内容可以准确的理解图像和分析图像。自然场景文本检测与识别的研究对于智能交通、视觉识别、图像翻译等领域都有重要的理论意义和实际价值。自然场景图像中面临着背景复杂多样、图像模糊分辨率低、单字符形式多变等困难。本文针对自然场景中两类具体的情况:受复杂背景干扰的简单场景和图像分辨率较低的模糊场景,进行了文本检测、字符切分、字符识别的研究。具体工作
论文部分内容阅读
自然场景图像中的文本蕴含关键的高层语义信息,识别出其中的文本内容可以准确的理解图像和分析图像。自然场景文本检测与识别的研究对于智能交通、视觉识别、图像翻译等领域都有重要的理论意义和实际价值。自然场景图像中面临着背景复杂多样、图像模糊分辨率低、单字符形式多变等困难。本文针对自然场景中两类具体的情况:受复杂背景干扰的简单场景和图像分辨率较低的模糊场景,进行了文本检测、字符切分、字符识别的研究。具体工作如下:(1)针对简单场景文本图像背景复杂的问题,提出了一种基于笔画宽度和剪枝算法的文本检测方法。通过设计的笔画宽度特征提取算法,能够获得每一个候选区的文本相似度;融合剪枝算法实现背景区域的滤除,生成的目标检测图像准确性高,较好的去除了复杂背景干扰区域。基于连通域的方法实现了简单场景文本检测,实验结果表明本文所提方法检测结果准确率达到0.78以上,滤除背景的效果良好。(2)针对模糊场景文本图像分辨率较低难以检测的问题,提出了一种改进导向滤波算法和边缘检测相结合的文本检测方法。采用暗通道理论和改进的基于均值的导向滤波算法进行去模糊的图像增强处理,突出了文本区域的边缘信息、增强了图像对比度。结合Sobel边缘检测和先验性规则完成候选文本区域的检测。利用图像增强算法改善模糊场景图像的清晰度,结合边缘信息完成了模糊场景图像的文本检测。本文方法的运行时间较快,检测的准确度不小于0.85,对模糊场景文本检测具有较好的效果。(3)针对自然场景单字符形式多变,难以切分与识别的问题,分别对简单场景和模糊场景的文本检测图像进行了单字符的行列切分,其中模糊场景下粘连字符的切分使用改进的垂直投影法,能够有效切割粘连字符。单个字符输入到经典的CNN(LeNet-5网络)完成了单个字符识别。使用字符间的空间特征有效解决了自然场景单字符难以切分的问题,并通过CNN实现了文本内容的识别。本文的识别网络框架测试识别率达到0.90以上,字符识别性能良好。综上,本文研究了简单场景下的文本检测、模糊场景下的文本检测以及字符的识别三个问题。将笔画宽度、连通域、导向滤波、边缘检测以及卷积神经网络等多项技术用于本文的研究。实验结果表明,本文提出的自然场景文本检测方法有较好的检测效果,使用的文本识别网络框架测试性能良好。
其他文献
水泥沥青复合胶结料(简称CA复合胶结料)是我国高速铁路建设中广泛采用的一种有机无机复合型胶结材料,主要应用于板式无砟轨道的水泥砂浆垫层作为粘合剂,在板式无砟轨道中起到支撑、调节及减震等重要作用。在温度及轮载的作用下,CA复合胶结料的蠕变行为对轨道结构的稳定性具有重要的影响。本文主要针对CA复合胶结料的蠕变及蠕变恢复性能开展研究,并分析蠕变损伤对其力学性能的影响。建立了考虑蠕变损伤的黏弹塑性力学模型
我国人口众多,对能源需求较大,伴随着科技发展,煤炭开采越来越容易,煤矿企业为了效益进行无节制的开采。而且煤矿企业环保意识不强、不合理开采,不只是造成了环境污染,地下煤层的开采使地表产生变形破坏,对人们生产生活造成严重的损失。所以全面了解煤矿采空区与地表变形的关系,必须加快研究地下矿产开采造成的地表沉陷的规律以及特征。通过对研究区进行实际的地面调查,对研究区内已发生的地面变形灾害进行了统计,整理和分
移动互联网和智能设备推动了无线数据服务的发展,对5G蜂窝无线网络的研究因此不断深入。不断发展的5G无线网络为无线通信提供了更高的数据速率,不仅可以增强用户体验质量,还可以减少端到端的延迟以及消耗的能量。随着数据传输需求的不断增加,以及来自不同领域的不同类型的数据的存在,无人机逐渐进入人们的视野,成为一种新型的数据传输方法和数据采集技术。同时,通信网络技术和信息技术的快速发展,以及现代社会信息的多样
航空航天飞行器等结构在工作过程中往往处于复杂的振动环境,本文对非白噪声环境激励下的结构模态参数识别进行研究,具有重要的工程意义和理论价值。本文的主要工作有:(1)研究了几种常规工作模态分析的时域方法,对自然激励法、时间序列法、特征系统实现算法和随机子空间法进行了理论推导和MATLAB程序化。通过基础激励梁的数值仿真和实验,对上述方法的识别效果进行了对比和验证。(2)研究了非均匀谱环境激励下常规工作
M2高速钢是重要的工具钢之一,但由于其高碳高合金含量的特征,易在凝固过程中析出大尺寸的共晶碳化物,这种碳化物在后续的锻造及热处理过程中很难被破碎,以大颗粒碳化物的形式遗留在最后的回火组织中,成为限制高速钢力学性能及使用寿命的主要因素。因此,优化高速钢的铸态组织,特别是解决高速钢中共晶碳化物的形貌及尺寸问题是提高高速钢使用性能的关键。但是传统的加工方法对于高速钢性能的提高受到很大的限制。近年来,由于
随着移动通信系统的快速发展,天线作为移动终端设备的最前端起着不可替代的作用,人们对于移动终端天线也逐渐提出了更高的要求。由于各种新的通信系统标准不断产生,因此,同时工作于多个频段的终端天线具有重要的研究价值。本文围绕研究课题,针对工作在2.4/5 GHz WLAN频段的高增益全向天线以及多频段的金属边框MIMO手机天线进行了研究。为进一步证明以上天线设计的准确性,对本文中所提出的设计均进行了实物加
目前,随着我国经济高速发展,人民对交通出行的需求也不断增长,导致现有的城市道路与出行需求间的矛盾不断加深。这一矛盾直接导致了交通事故多发等严重问题的产生,威胁着人民的生命与财产安全。目前,通过分析与交通事故相关的交通流特征,从而提出具有针对性的对策意见,进而提升城市道路安全性,已经成为主要的城市道路交通安全研究方向之一,国内外学者在这一领域进行了深入而全面的研究,并逐渐将目光投向了因车辆转向、变道
目的β-1,3-半乳糖基转移酶2(β-1,3-galactosyltransferase 2,B3galt2)属于β-1,3-半乳糖基转移酶家族,是糖基转移酶中的主要类型之一。最近的研究表明β-1,3-半乳糖基转移酶2在神经系统中发挥重要的作用,β-1,3-半乳糖基转移酶2基因的敲除对成年小鼠学习记忆、海马内神经元及突触都有一定的影响。然而其在成年神经再生中的作用尚未有报道。通过探究B3galt2
近年来,癌症成为威胁人类生命健康的主要杀手,因此寻找到一种快速有效的诊断和治疗癌症的方法成为医学界乃至整个科学界积极探索的目标。而近红外光热治疗作为一种新型的癌症治疗方法引起了人们的广泛关注,其原理主要是利用光热试剂将光能转化为热能从而杀死癌细胞,由此可见光热试剂在整个光热治疗过程中扮演着十分重要的角色。常用的光热试剂主要有光敏材料和纳米材料,其中金纳米材料由于其特有的局域表面等离子激元共振特性(
目的探究基于磁共振成像(Magnetic resonance imaging,MRI)的delta-影像组学特征在预测局部进展期直肠癌新辅助放化疗(Neoadjuvant chemoradiotherapy,nCRT)后病理完全缓解(Pathological complete response,pCR)中的价值。方法回顾性纳入中国医学科学院肿瘤医院2015年1月至2018年6月172例局部进展期直