论文部分内容阅读
目标识别是计算机视觉领域中的重要课题之一,长久以来备受各行业研究人员的关注。随着计算机视觉技术的发展和普及,目标识别的研究也随之具有了更高的现实意义和应用价值。本文以目标的轮廓形状作为原始数据,研究了一系列的轮廓形状描述方法、轮廓简化方法、形状匹配和目标识别方法,以及其在手势识别中的应用。本文首先提出了一种基于多尺度不变量描述的目标识别方法。该方法使用多尺度不变量描述对目标形状进行表示,并使用自适应离散轮廓演化算法对轮廓形状进行自适应地简化。经过描述与化简步骤之后,动态时间规整算法被用于对不同的轮廓点序列进行匹配并计算它们之间的相似度。为了对目标数据库的先验知识进行充分利用,本文在多尺度不变量描述的基础上引入度量学习方法,以提升新的目标识别方法的识别性能。该方法首先定义了一种特征点袋算法,在使用多尺度不变量描述和自适应离散轮廓演化算法得到目标轮廓显著特征点的基础上进行聚类学习,以获得轮廓形状的直方图表示。相关成分分析算法被引入直方图的匹配过程中,用于对不同维度的向量进行合理的权重分配,并在此基础上计算不同目标形状的直方图之间的欧氏距离,以完成目标识别。本文在对复杂的目标形状进行特征分析之后,提出了一种针对多尺度不变量描述的改进方法。该改进方法引入轮廓的形状上下文信息,构造了两种新的不变量:面积差分不变量和弧长差分不变量,用于对多尺度不变量描述进行补充。实验结果验证了改进后的多尺度不变量方法具有良好的不变性、分辨力和鲁棒性,同时以此为基础的目标识别方法在各标准形状数据库中也取得了优秀的成绩。最后,本文的研究理论被用在基于RGB-D数据的手势识别应用中。借助Kinect相机提供的RGB-D数据,本文研究的目标识别方法以多尺度不变量描述为基础,被整合为一套完整的实时手势识别系统。这一系统在手势识别实验中高达96.4%的识别精度和仅耗时0.0387秒的识别效率,验证了本文所提出方法的高效性和实用性。