基于表格的影像文档类别的识别方法研究

来源 :五邑大学 | 被引量 : 0次 | 上传用户:dingjk3883085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于表格的影像文档类型识别是影像文档识别的一个重要组成部分,是图像处理与模式识别领域内一个重要的研究课题。随着表格识别过程中信息域定位和提取、字符切分、字符识别技术的不断完善,特别是单字识别技术的日趋成熟,基于表格的影像文档类型识别的适应性和鲁棒性甚至通用性就成为了该领域内的一个研究热点。 针对如何加强基于表格的影像文档类型识别技术的适应性和鲁棒性,本文进行了广泛的研究。并按照模式识别过程图像预处理、特征提取和模式识别对各部分分别进行了系统的研究和探讨。 在图像预处理阶段,本文对经过标准化处理的表格图像进行了灰度变换、图像平滑、二值化、倾斜矫正和边缘检测。 在特征提取阶段,本文根据特征提取技术和人类感知机理,提出了采用不变矩变换和具有与人类视觉基元相似性质的Gabor小波变换作为特征采集手段,分别提取待识别目标的全局特征和局部特征,并在保留这两种特征优点的情况下对其融合,产生新的特征。 在模式识别阶段,把融合后的特征输入神经网络和支持向量机进行表格图像类型识别和分类,通过分别使用RBF神经网络和支持向量机对样本进行训练和识别。实验结果表明此分类识别算法有更好的自适应性和鲁棒性,并且该识别技术具有较高的识别率。
其他文献
随着认知心理学、生物神经学等学科的不断发展,人们已经发现已有的视觉计算理论与生物视觉机理有较大的差异,视觉计算理论很难把许多生物视觉的特征准确地表现出来,因此研究
随着数字化、信息化、网络化的发展与应用,计算机中文件安全性问题成了保证信息系统正常运行、发挥效能的不可忽视的重要因素,而可信计算技术作为全球计算机技术发展的一种新趋
随着医学影像处理与分析这门学科的发展,针对医学影像的图像分割领域出现了很多新的方法。但是其中的许多方法都专门应用于特定的处理对象,并无通用的理论或方法,若将其应用
决策系统的知识约简是粗糙集理论的精髓之一。利用粗糙集理论及其约简算法可以进行决策制定、知识获取、机器学习、模型建立等,知识约简离不开一系列的算法作支撑,包括判断属性
数据流处理技术是最近几年数据库领域的一个新的研究方向,由于其广泛的应用前景而得到了广大研究人员的关注。分布式系统具有廉价的成本、强大的处理能力,处理速度快、数据量
视频图像修复是目前亟待解决的一项技术,用这项技术可以修复一些年代久远的存储在模拟胶片或模拟磁带中的视频图像。本文研究的图像增强算法是视频图像修复的前期工作,它对改
近年来,随着轨道交通的长足发展,大规模运营数据沉积在轨道交通AFC中央数据库中。在对轨道交通数据进行科学处理时,往往会因为其具有规模大、特征复杂等特点,使得理解、分析
目前移动通信标准繁多,新旧体制混杂,传统的无线电通信系统很难适应其发展。为了实现互连互通,比较可行的方法是采用软件无线电技术。其中心思想是:构造一个开放性、标准化、模块
本文以江西省国税局多元化电子申报纳税系统为背景,基于面向对象的思想设计并实现了一个可以通过互联网、程控电话网、银行网点等多种途径完成纳税申报的信息系统。该系统具
网格计算是伴随着互联网而迅速发展起来的专门针对复杂科学计算的新型计算模型,被称为第三代Internet。网格计算将地理上分布的计算资源充分利用起来,协同解决复杂的大规模问