基于图像增强的多特征自然场景文本检测研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户：xiaozi134

【摘要】

：

随着智能终端的普及以及网络技术的发展,移动互联网逐渐全面接轨人们的生活,文本信息正广泛地以图片的形式被记录和传播,因此从图像中提取文本为人们接收环境信息提供了极大

【作者】

：

陈硕

【出处】

：

武汉理工大学

【发表日期】

：

2018年01期

【关键词】

：

文本检测 MSER 图像增强特征结合通道融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着智能终端的普及以及网络技术的发展,移动互联网逐渐全面接轨人们的生活,文本信息正广泛地以图片的形式被记录和传播,因此从图像中提取文本为人们接收环境信息提供了极大的便捷。文本检测作为提取文本信息的基础,其鲁棒性和准确性将直接影响后续的文本识别和图像应用。自然场景图片存在大量干扰因素,给检测带来了诸多不确定性。所以自然场景文本检测具有挑战性和实用价值。本文的主要研究工作如下:(1)图像增强和候选区域提取。选用最稳定极值区域(Maximally Stable Extremal Regions,MSER)方法提取文本候选区域。通过分析MSER检测的局限性,发现MSER对低对比度图像的检测性能较差,且只检测灰度通道会损失大量图像信息。因此本文提出一种图像评估方法,根据灰度分布和边缘投影判断图像是否属于低对比度图,并对低对比度图像采取对比度增强处理。采用RGB和基于感知的光照不变(Perception-based Illumination Invariant,PII)颜色通道以及显著图代替灰度通道实现多通道MSER检测,可以充分利用图像的颜色信息并消除细小遮挡物的影响。(2)提取候选区域特征并分类。提取Gabor特征、局部二值模式(Local Binary Pattern,LBP)特征和方向梯度直方图(Histogram of Oriented Gradient,HOG)特征三种纹理特征,并针对纹理特征的局限性,结合使用笔画相关特征——边界角点数和笔画面积比。针对笔画相关特征在实际应用产生的检测偏差问题,提高分类效果。分别使用AdaBoost和支持向量机(Support Vector Machine,SVM)对不同特征结合进行性能测试,选取最佳特征组合和分类器。(3)融合多通道信息并合并文本行。多通道MSER导致候选区域分布在各个通道且存在差异,针对这一问题采取多通道信息融合方法。融合后,单个字符对应多个候选区域,严重影响文本行聚合,通过分析候选区域的重叠类型和颜色变化率,对重叠的候选区域进行去重处理。针对文本行中字符的临近性原则和相似性,采取搜索范围约束方法,并结合霍夫变换原理将字符单量合并成文本行,得到最后的检测结果。使用ICDAR2015公开数据库对算法进行检测,可得到79.3%的准确率和72.8%的召回率,检测效果有所提升。

其他文献

高中英语阅读生态课堂构建研究

传统课堂教学模式难以适应高中新课改的发展,因此在常规的教学中出现了多样化的课堂,而强调以生为本的生态课堂便是其中的一种。生态课堂的宏观研究比较广泛,但是结合具体学科的微观研究比较空缺,而英语阅读在英语教学中占据着重要地位。因此,本文旨在通过研究高中英语阅读生态课堂的具体构建途径,以丰富其在教学中的微观研究,也为高中英语阅读教学中提供一些具体的指导性意见,增强英语阅读教学效果。本文在课堂观察法和问卷

学位

英语阅读生态课堂构建

论符洪铭的治校品格

符洪铭,现任浙江省宁海中学校长,曾获全国优秀教师、浙江省春蚕奖、宁波市首届名校长等荣誉称号。厚重的荣誉背后蕴藏着其对教育的探索和追求,也寄予着其颇具特色的治校品格

期刊

宁海中学王阳明知行合一浙江省余姚市高一新生杰出思想家宁海县春蚕教育理想化学系

直线加速器灯光野切换故障维修与分析

直线加速器是目前治疗恶性肿瘤的重要手段之一．治疗的过程包括病变靶区和重要器官的空间定位、治疗计划设计、治疗方案模拟及治疗方案实施4个阶段,

期刊

直线加速器故障维修灯光野治疗计划设计治疗方案空间定位恶性肿瘤

基于图像增强的多特征自然场景文本检测研究

其他学术论文