论文部分内容阅读
符号识别和形状检索在工程图纸、历史文档、乐谱、数学表达式等的自动分析与识别中发挥着非常重要的作用。一个理想的符号识别算法应该通用、计算效率高、易扩展,且在噪声、旋转、变形等情况下仍然具有较强的鲁棒性。虽然到目前为止,研究人员已经做出了很多努力,但仍然很难找到一个能够满足各种要求的符号识别方法。本文对存在噪声、旋转、缩放等多种退化情况下的二值符号识别问题进行了深入研究,提出了一种新的符号识别方法——基于多参考点直方图矩阵描述的符号识别方法。对于每一个符号,本文首先生成一系列大小相同的网格,并在每个网格内利用Hough变换算法来同时进行线条增强和噪声滤除,然后在每个网格内选定一个参考点,计算每一对像素对于该参考点的局部分布,最后将每个参考点的局部分布集成起来形成全局约束分布,进而实现图形匹配、符号识别。本文的主要贡献如下:1.对于二值线条图,以往的方法,若是先进行噪声去除,有可能把有效像素当成噪声过滤掉;若先进行线条增强,噪声像素一般会误导增强过程。本文提出了一种新的通过网格内Hough线条追踪来同时进行线条增强和噪声滤除的方法,从而在一定程度上避免了上述噪声像素滤除与前景像素增强两难的问题;2.在二值符号识别研究中,通过深入分析一系列基于约束分布的统计直方图识别方法,提出了一种基于多参考点直方图矩阵描述的符号识别方法,该方法能够对有噪声、扭曲、变形等各类退化情况干扰下的二值符号进行有效识别;另外该方法不需限定具体领域,对不同领域内的符号别问题有较好的适用性;3.针对自然场景中的交通标志识别问题,本文进行了初步探索,并结合已提出的二值符号识别算法,设计出一个基于几何约束分布统计特征的交通标志识别系统。实验表明,该系统能够较好的识别部分自然场景中的交通标志符号。