论文部分内容阅读
随着信息技术的发展,文档图像在办公自动化、数字图书馆、网上阅卷、电子商务、电子政务等项目中获得广泛的应用。在这些应用中,纸质文档通常采用扫描方式形成数字化文档图像进行存储、传输、显示和打印。为了保证对文档图像的有效处理,对文档图像的分割研究显得尤为重要。论文分析了文档图像的特点,指出文档图像是由一些具有特定性质的区域块组合而成,通常包括文字块、线图、连续色调图像(真彩色图)和半色调图像(带调色板的图)。其中,文字和线图保存了图像较多的细节以及结构信息,具有较高的空间分辨率特征,这一部分区域对颜色分辨率的要求不高;而连续色调和半色调的图像则保存了较多的颜色信息,通常要求较高的颜色分辨率,但对空间分辨率的要求不高。也就是说文档图像大多数是由具有明显不同特征的部分组合而成,通常来说包含文本区域、线图区域和插图区域,而文本区域又包含文字的轮廓和文字的背景颜色,插图区域通常是高分辨率的彩色图像。这些区域不仅在逻辑意义上具有独立性,而且在颜色分辨率和空间分辨率上也具有明显不同的特性。这种图像特征明显却逻辑上具有独立性的文档图像更适合利用具有全局分割特性的分割方法去处理。基于图论的图像分割是近年来正处在发展中的一种新兴的图像分割技术。该技术具有全局分割特性。本文介绍和阐述了整合图像分割和图割理论的基本框架。一幅图像可以被映射成一个加权的无向图,其中像素点被当作图中的顶点,而相邻的像素之间的视觉性质(比如灰度级别,颜色或者纹理)的相似度当作相应的边的权值,于是图像的分割结果就可以通过对图的最小割方法来获得。具体研究了归一化方法。基于Ncut的图像分割方法有很多优点,能够给出具有全局特征分割结果,具有很好的数学理论背景,但是也隐藏了一些缺点。比如算法中涉及到特征方程的求解问题,计算量过打,不适合大幅图像的分割,为了使该方法具有实用性,本文使用自适应像素块映射为单一的节点,降低生成图的边和节点数目;修改邻域系统适应块结构,提高区域间邻近性和连续性,通过试验证明得到了可以接受的算法效率。为了提高计算速度,我们受到著名的多分辨率信号处理和金字塔型结构的启发,引入了一种用于图分割计算的多尺度计算方法。最后我们进行了几个数值实验,结果表明这种多尺度计算方法能够降低分割算法的运算时间,并且能够获得与传统分割方法近似相同的分割结果,特别是对于图像中所要分割目标在整个图中所占比例较小的情况,速度提高更为明显。