页面倾斜检测与版面分析算法的研究

被引量 : 0次 | 上传用户:QQ329431503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
版面分析与理解技术主要研究如何将纸质文档转化为电子表示,并进一步理解为计算机可处理的符号表示的整个过程。版面分析与理解技术是OCR(光字符识别)系统的重要组成部分。论文首先简述了OCR系统及其与页面倾斜检测与版面分析的关系;总结回顾了该领域发展历程和现状。接着从文档图像的特点出发,介绍了几种图像平滑和二值化方法。通过实验分析,比较了这些算法的实验及优劣。针对扫描图像可能产生的倾斜,论文提出了一种基于图像的逻辑运算和最小二乘法的页面倾斜检测方法:首先定义了一系列逻辑运算算子;在分析算子性质的基础上,阐述了性质对算法的指导意义;最后给出了算法的具体实现。实验结果表明该算法具有准确度高、速度快而且与内容无关等优点,具有一定的理论价值和较强的实用价值。版面分析中,基于递归和投影的多又树模型算法是版面分割一个经典的算法,但该算法的实验性能严重受限于阈值的选取,如果阈值的选取不当,将造成文本区域的过分割现象。为了克服这个缺点,论文提出了一种改进算法,它引入了“自底向上”策略中的区域合并思想,从而改善了传统算法的实验性能,提高了算法的鲁棒性。最后用基于连通域特征值的方法进行区域识别。随后论文对版面分割和区域识别算法的实验数据进行了图表分析,给出了算法的优缺点,探讨了导致算法不足的原因。最后,总结了论文的成果和不足,给出了对该领域研究的看法和做论文期间的体会。
其他文献
节能环保已逐步成为世界潮流,在各大城市中,道路照明节能也日益成为人们的关注点。简单来说,道路照明节能主要可以从线路、光源和运行方式上来做出具体节能举措。三种不同的
文章论述了基于LabWindows/CVI环境,利用SQLToolkit工具包,通过建立数据表,添加、查询、删除记录等数据库操作,实现对板级自动测试系统中测试数据的管理。
为寻求减轻桃低温冷害的有效方法和提高桃贮藏保鲜效果的措施,以‘八月脆’桃为试材,研究了不同温度模式、不同气体成分和高氧处理等对其采后品质及生理生化的影响,。结果表明:逐
鸟羽根据其主要特征可以分为正羽,绒羽和纤羽.正羽又包括飞羽,尾羽.本文主要是通过显微镜观察鸽子的飞羽,尾羽的微观结构进行观察研究,结果表明:具有飞翔功能的飞羽、尾羽主要是由有
现代商事交易往往是跨越地区和国界的买卖,货物的交付过程较为繁琐,大多要经过空运、海运或陆路运输。在这期间,货物难免要遭受各种意外损失,如盗窃、火灾、沉船、破碎、渗漏以及
热处理工艺研究结果表明 ,S7钢 (0 .5 6C 1.2 4Mo 3.0Cr 0 .2V)最佳退火工艺为 810~ 830℃加热 ,15~ 30℃ h冷却 ,硬度值不超过HB2 0 0 ,在 880~ 910℃加热淬火 ,5 5 0~ 6 0 0℃
近几年随着国家基本建设力度的加大和西部大开发的进行,边坡支护建设工程中所遇到的岩质边坡稳定性问题也相应地增多。但在边坡的施工过程中,边坡失稳现象却时有发生,而边坡一旦
变电站接地网不仅为变电站内的各种电气设备提供一个公共的参考地,而且能在电力系统发生故障时,将故障电流迅速排泄入地,控制接地网的最大电位升高,保证人身和设备安全。所以,合格
2015年3月15日,十二届全国人大第三次会议正式通过了《全国人民代表大会关于修改的决定》,这是本次全国人大会议审议通过的唯一的法律修正案。这次《立法法》修订对于进一步
随着科学技术的不断发展,新型数字化船用仪器如ECDIS(Electronic Chart Display and Information System,电子海图显示与信息系统)、AIS(Automatic Identification System,自动