基于Snakes模型的中文扭曲文档图像校正技术研究

来源 :北方工业大学 | 被引量 : 3次 | 上传用户:junbobo126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和计算机信息技术的发展,数字图像处理技术已经深入到我们生活中的方方面面,通过图像采集将传统纸质文档电子化已经成为一种趋势;然而,在通过扫描仪或数码产品获得图像的过程,可能伴随着文档表面倾斜、弯曲或人工操作的视角倾斜等原因,仪器得到的图像可能会有一定程度的失真,如倾斜、扭曲、形变等,这些问题都会对文字处理软件如OCR识别、版面分析等的处理造成极大的困难,也可能这些软件根本无法识别获得的文档图像;因此,需要对这些变形扭曲的文档图像进行校正复原。本文将致力于解决扭曲图像的校正恢复问题;通过对扭曲文档图像特征及中文汉字结构的分析,并参考国内外相关的经典校正算法,对比分析各种方法的优缺点,针对中文扭曲文档图像给出了基于Snakes模型的校正算法。该方法为实现扭曲文档图像的校正处理,考虑到光照不均、过度曝光等因素造成较差二值化效果的不利影响,本文不做二值化处理,直接从灰度化后的图像着手。在灰度图像的基础上,通过优化后的高斯滤波处理使得文字行实现平滑的效果,达到增强文本行结构的同时也能很好的保护图像边缘信息的目的;然后利用脊线检测找出文本行的中心线,并将其初始化作为Snakes模型的初始轮廓线;然后利用图像分割的思想通过对Snakes模型的能量泛函迭代法求极小值的过程,使得中心线向文本行上下边缘移动,并根据图像的阈值信息把两条线闭合,然后根据字符文本的灰度信息进行扩张或缩放,完成文本行的分割并获得其文本线,最后利用文本行信息拟合重构其文本线实现校正。实验结果表明该算法能有效地恢复扭曲,使得校正后的OCR文字识别率比之前有明显的提升;而且该算法实现简单,对于扭曲文本行的分割精度非常高,算法鲁棒性较强,基本满足实用性需求。
其他文献
1传染性鼻炎1.1流行特点及外观症状本病是由副鸡嗜血杆菌引起的一种急性呼吸道病。蛋鸡在冬春干燥季节较高发,鸡群发病后,出现呼吸道症状,流鼻涕,先清涕后黄浓涕,脸部肿胀,眼窝下窦
研讨背景:课堂常规是体育课正常开展的有力保证,也是提高教学质量的基础,只有更好地落实体育课堂教学常规,才能有效提高课堂教学质量。基于很多教师实践中落实较难的问题,本
本文从防水堵漏材料的选择、防水堵漏的构造,详细说明了防水堵漏材料的施工。目前的防水堵漏材料主要有:灌浆止漏胶、无收缩水泥灌浆料、抗渗、抗渗密封胶、钢板止水带、快速
随着现代科技的发展,我们已经进入到了信息化的新时代。但是,就目前世界水平而言,我国计算机应用技术水平受到了诸多因素的限制,技术仍然较低。再加上国家资金投入较少,导致
新的时代观念给青铜铸造件浮雕艺术手法一个新的定义。青铜铸造件浮雕艺术手法在园林景观中的设计,就是一个很好的例证。文章主要介绍了青铜铸造件的制造工艺,重点分析了浮雕
董玮,号师鼎堂、钝庐,1974年生于河南郸城。中国艺术研究院艺术硕士。中国书法家协会会员、文化部青联中国书法篆刻艺委会委员。现为中国艺术研究院中国书法院教学部主任,《艺术中国》、《尚艺书法》副主编。出版有《痕迹·中国书法院助教日志》、《董玮书法作品集》、《全国青年书法名家邀请展·董玮》等。  圣贤孔子曾言“仁者不忧,智者不惑,勇者不惧”,其意大抵为:有仁心的人,不因环境而动摇,没有忧烦;真正有智慧
目的了解维持性血液透析(maintenance hemodialysis,MHD)患者营养状况及发生营养不良的常见膳食危险因素,为针对性营养干预提供依据。方法采用主观全面评定法(SGA)和营养不良风险
目的:对于原发性肝癌(PLC)合并门静脉癌栓(PVTT)病人,比较肝动脉化疗栓塞(TACE)和保守治疗的疗效,探讨不同程度的PVTT对治疗及预后的影响。方法:从2008年12月到2009年12月,我
如果说《钱经》最初提出“中国投资理财第一刊”的口号还代表着一种愿景的话,那么六年来的发展历程显示:第一刊的地位越来越稳固,也为业界所承认。而且《钱经》从来没有想过“守
就临床医学专业的基础医学教学中,对基础医学课程体系、基础与临床的联系、基础医学中的PBL教学以及人文社会科学、行为科学与医学学科的结合等内容进行了讨论。