论文部分内容阅读
文档图像二值化是文档分析与识别(DAR)技术中极其重要的一个关键环节,二值化的好坏对整个DAR系统的性能起着决定性作用。由于低质量文档图像自身的复杂性以及退化因素的多样性(如墨迹浸润、页面污迹、光照不均、背景纹理等),要找到一种适应各类型退化图像的二值化算法成为学术界关注的热点问题。本文的主要工作如下:(1)针对退化图像常有的弱对比度现象,提出基于高对比度像素检测和笔画宽度变换的二值化方法。该算法首先对输入的彩色文档图像进行最小均值(Min-avg)灰度化,既能增加前景与背景的对比度,又减小了前景像素间的灰度差异;其次采用非线性双边滤波算法滤除噪声,由于结合了像素空间邻近度及灰度相似性,具有保边除噪的优点;然后通过局部对比度增强技术,使图像具有明显的双峰特征,并利用全局最优阈值法(Otsu算法)检测出高对比度像素作为“种子”像素;最后,采用笔画宽度变换算法(SWT)估计图像的笔画宽度,并确定滑动窗口的大小,从而实现基于邻域窗的局部精细二值化。结果表明,该算法在抑制背景的同时,能较完整地保留字符前景,实现正确分类。(2)针对低质量图像存在复杂变化的背景特性,提出基于背景估计和能量最小化的二值化方法。首先沿用了前述算法的预处理过程(最小均值灰度化和双边滤波去噪);然后通过形态学闭操作估计出图像的大致背景,并根据差值图像确定高置信背景像素,从而去除估计背景;之后对背景减除图像构造Laplacian能量函数,基于此能量函数将图像映射为图结构;最后根据图论算法的原理,采用网络最大流方法使能量函数取最小值,求得最优二值图像。实验表明,去除估计背景后的图像对比度有明显提升,前景与背景的分割更精确。(3)对本文研究的两种方法和七种经典方法进行对比分析,选用国际文档图像二值化竞赛(DIBCO)评判指标作为衡量评价算法性能的指标参数。实验证明,本文两种方法相比于性能较好的LMM算法在F-measure上分别有0.5%和3%的提升。