论文部分内容阅读
基于表格的影像文档类型识别是影像文档识别的一个重要组成部分,是图像处理与模式识别领域内一个重要的研究课题。随着表格识别过程中信息域定位和提取、字符切分、字符识别技术的不断完善,特别是单字识别技术的日趋成熟,基于表格的影像文档类型识别的适应性和鲁棒性甚至通用性就成为了该领域内的一个研究热点。
针对如何加强基于表格的影像文档类型识别技术的适应性和鲁棒性,本文进行了广泛的研究。并按照模式识别过程图像预处理、特征提取和模式识别对各部分分别进行了系统的研究和探讨。
在图像预处理阶段,本文对经过标准化处理的表格图像进行了灰度变换、图像平滑、二值化、倾斜矫正和边缘检测。
在特征提取阶段,本文根据特征提取技术和人类感知机理,提出了采用不变矩变换和具有与人类视觉基元相似性质的Gabor小波变换作为特征采集手段,分别提取待识别目标的全局特征和局部特征,并在保留这两种特征优点的情况下对其融合,产生新的特征。
在模式识别阶段,把融合后的特征输入神经网络和支持向量机进行表格图像类型识别和分类,通过分别使用RBF神经网络和支持向量机对样本进行训练和识别。实验结果表明此分类识别算法有更好的自适应性和鲁棒性,并且该识别技术具有较高的识别率。