自然场景图片中文本定位方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:xy479977530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中的文本定位方法研究是文本检测领域的难点。随着科学技术的发展,人们对于信息获取的来源不再仅限于书本杂志,在随处可见的自然场景中包含了丰富的信息,因此如何快速准确的获取到自然场景中的文本信息显得尤为重要。目前,有许多专家学者基于各种特征进行文本定位,然而受自然场景中复杂背景环境及拍摄设备等因素影响,文本定位的准确度仍不够理想。针对自然场景图像视点不同所产生的文本形变及对不同语言文本适用性的问题,本文提出了一种基于最大稳定极值区域特征与优化的笔划宽度变化特征融合的文本定位方法,利用最大稳定极值区域的仿射不变性及不同语言文字笔划宽度均稳定变化的特点来获取图像中的候选文本区域,并对候选文本域进行过滤筛选,从而得到较好的定位效果。本文主要运用了图像灰度化处理、图像边缘化处理、最大稳定极值区域特征提取、笔划宽度变化特征提取、先验信息过滤等方法,主要包含了以下几方面的工作:(1)本文介绍了目前自然场景中文本定位方法的研究背景与现状,并对经典场景文本定位方法的实现原理及实验流程进行了详细分析,概括了各经典方法的特点及优劣,作为文本定位方法中特征选取的理论基础及依据。(2)基于最大稳定极值区域特征对自然场景图像进行文本域的获取,利用最大稳定极值区域的仿射不变性和高鲁棒性特点,解决自然场景图像拍摄视点不定导致文本形变的问题。该方法首先对图像进行灰度化处理,并通过计算阈值变化过程中图像极值区域面积的最小变化率来提取最大稳定极值区域,然后利用先验信息等方法过滤非文本域,进而得到最终结果。(3)本文提出了基于最大稳定极值区域和优化的笔划宽度变化特征融合的文本定位方法。该方法在保留最大稳定极值区域仿射不变性的同时,融入的笔划宽度变化特征,利用该特征对各种语言及字体形式文本的通用性,提高定位方法的适用范围。首先对场景图像进行预处理,然后提取图像的最大稳定极值区域特征及优化笔划宽度变化特征,基于特征生成候选连通域并过滤合并,最后得到连续的文本区域。实验结果显示,该方法既可以解决自然场景图像中的文本形变问题,也可以很好地适用于各种语言及形式的文本,能够较为准确的定位出自然场景中文本。未来可针对部分特殊的场景环境作进一步的研究,例如提高对强光照射或者光线昏暗的场景中文本区域获取的准确性等,并可着力于减少文本定位方法的计算成本及时间复杂度。
其他文献
Android系统因其开源性的特点、无需支付任何费用等优点,得到广大开发爱好者的青睐,不管是我们所熟知的QQ、微博等即时通信软件,还是我们使用频率较高的支付宝、微信等移动支
本文首先对空间管制的现状矛盾进行辨识和探究,提出目前空间管制规划的内容多为要素叠加,缺乏对区域整体生态安全的关注;规划编制缺少至上而下的逻辑联系;管理权限分散,并存
近几年,财产保险公司业务创新不断,推动着保险事业之发展。其中诉讼财产保全责任保险这一险种,由于为法院诉讼程序中的当事人提供财产保全担保,从而引起基于诉讼财产保全责任
会议
复习是对理论知识巩固加强的过程,所谓温故而知新,开展小学数学复习课堂,有利于让学生自查数学理论知识,全面学习数学内容,避免出现知识的缺失。四步五环节是打造小学数学复
本试验以川西北红原县牧区为主要研究对象,对影响红原县人工草地建植适宜性的17个指标进行筛选确立、评分、采样和空间结构分析,并对确立的各指标空间分布状况进行绘制。采用
随着社会经济发展和地震工程学科的不断进步,消能减震技术越来越多的被应用于新结构设计和既有结构抗震加固中。作为一种构造相对简单、性能比较稳定的结构消能器,屈曲约束支
工件在经历铸造、锻造、机加工、焊接等工艺后其内部会产生内应力,使工件在使用中极容易产生破坏。这就要求对工件进行时效处理以消除其内应力。但是随着科学技术的发展,传统
数据合规是指企业及其员工的数据活动需要符合一切规则。网络安全法为企业指明数据合规的方向,数据合规成为一个重要的时代课题。数据与信息、隐私既有联系,也有区别,需要合
目前变电站的巡检工作以单个的手持记录仪来完成的,没有形成一个关联的后台监控系统。论文以新形式下变电站巡检的最新要求为目标,构建基于网络的巡检人员、运维人员的多级变
随着海量的互联网数据不断增加,数字图像资源也与日俱增,面对大量的数据,人们希望计算机能够更加智能的对其进行分析处理,自动完成对海量数据的压缩、编码及冗余处理等工作,