论文部分内容阅读
随着个人电子设备的广泛应用以及设备性能的不断提高,人们需要处理越来越多的图像数据。计算机技术的不断提升,加速了人们利用计算机来理解和处理这些图像数据的进程。为了有效地管理和理解这些数据,图像底层特征(颜色、纹理、形状等)成为解决这一问题的重要元素。形状作为一种最具感知意义的特征,成为研究人员热点研究对象。与形状匹配和识别相关的应用越来越多(如数字识别、商标检索、行为识别、人体姿态估计),人们希望能有更好的算法来处理研究中所面临的问题。这些使得形状的匹配和识别成为一个具有理论和实践意义的研究课题。在当前众多形状匹配方法中,基于轮廓的方法所表现出的良好性能优势和相当的发展潜力,使其成为该领域十分活跃的研究课题,但同时也存在诸多挑战。本文立足于对形状匹配原理的思考,从计算机视觉的角度出发,对基于轮廓的形状匹配作了较深入的研究。针对现有算法存在的问题,主要完成了以下研究工作:(1)现有基于轮廓的形状匹配算法在完成轮廓对应时大多采用一对一的映射模型。一对一映射模型在各算法中表现出了较好的性能,但仍存在一定问题。由于没有考虑到轮廓点在形状上的位置属性,基于一对一映射的算法容易出现误匹配的情况。为了降低误匹配率,本文将点之间的位置关系加入到形状匹配模型中,提出一种点对映射的形状相似性度量模型,并用核函数来定义点对映射的关系值。为了提高形状识别的正确率,利用形状识别的特性,本文提出一种度量待识别形状与模型形状之间的距离的方法,该方法有效地提高了形状识别的正确率。(2)极坐标系是一种被广泛应用的二维坐标系,受极坐标矩阵和形状上下文方法的启发,本文将两者结合得到一种全局形状上下文描述子。为了降低形状边界上离散像素点对描述子的影响,本文从人类视觉感知出发,用角度梯度来简化形状。由于忽略了形状边界上的微小变化,经过简化后的形状所提取的全局上下文描述子更具抗噪能力。为了验证算法的有效性,本文在通用的标准测试集MPEG-7CE-Shape-1上进行了实验,该测试集包含的形状丰富,是一个被广泛使用的形状数据库。Bulls-eye标准对算法检索率的评判,证明了本文两种算法都具有尺度和旋转不变性。在形状检索部分,点对映射形状匹配算法所得检索率为93.1%,超过了SC和IDSC两种算法;全局形状上下文匹配算法所得检索率为85.1%,超过了SC而与IDSC相当。从运行时间来看,GSC算法提取描述子的时间低于SC和IDSC两种描述子所提取的时间。