论文部分内容阅读
考卷内容的自动化识别是考试内容信息化的关键技术,它是实现纸质考卷数字化的重要环节。本文以考卷图像为研究对象,重点研究图像去噪、图像倾斜校正、版面分割、手写数字识别等关键技术,并实现了一个考卷识别系统。具体内容如下:(1)提出并实现了一种基于形态学的考卷图像去噪方法。针对考卷图像中前景和背景灰度值差距较大的特点,通过二值化处理把纹理和噪声这两部分内容与背景区分开来;根据考卷图像较为规律的灰度结构特性,设计了一组形态学滤波器,进一步对纹理和噪声进行区分,并使用连通域划分的方法保留了纹理细节。实验结果表明,本文提出的去噪方法在考卷图像上,与传统方法相比具有较好的视觉效果且在均方误差标准下最接近原图。(2)设计并实现了一种基于mark点的考卷图像倾斜校正方法。根据考卷图像的布局特性设计了一组用于几何校正的mark点。在mark点定位方面,本文针对考卷图像具有明显边界的属性,先粗定位mark点的待搜索区域。在此基础上利用轮廓跟踪技术得到候选mark点轮廓描述信息,进一步通过形状、占空比、大小等特征筛选出真实mark点。利用mark点的几何关系判断考卷图像的上下颠倒情况并计算出倾斜角度。根据倾斜角度,采用基于改进DDA的快速旋转算法校正图像。实验结果显示,所提方法可以快速有效的实现考卷图像的倾斜校正。(3)研究并实现了一种基于分割线构图的版面分割算法。由于考卷版面边界多为规则矩形,本文利用游程编码筛选得到待选分割线。根据同一方向的待选分割线呈明显线簇的特点,对待选分割线使用层次聚类算法,得到水平和竖直方向上的分割矩形块,并取矩形中线获取版面分割线。以版面分割线为基础构造无向图,使用最小环算法在无向图中寻找版面区域。本文针对不同版面的考卷进行了版面分割实验,结果表明该算法可以有效实现考卷图像的版面分割。(4)提出并实现了一种基于卷积神经网络的模糊手写体数字识别框架。使用LeNet-5解决考卷图像中的学生手写学号和教师手写得分的识别问题;若考卷中手写数字过小,在进行归一化后会导致图像模糊。为此针对图像模糊导致的字符识别率下降问题,将图像增强网络和手写数字识别网络相结合,组成模糊图像识别框架,并使用本文提出的模型训练策略进行参数训练。实验结果表明,本文提出的框架可以在手写数字识别前使模糊图像的质量得到有效改善,并有效提高了模糊图像中手写数字的识别率。(5)介绍了一个基于本文研究内容构建的考卷识别系统。分析了考卷识别系统的硬件需求和设计要点,并介绍了主要功能模块。