论文部分内容阅读
自然的人机交互方式一直是人们追求的目标,国内外对手势识别的研究一直没有停止过。微软研究的Kinect设备的问世,掀起了人们基于Kinect设备研究手势识别的新热潮。而且近年来,虚拟现实越来越火热,人们对这个领域投入的人力和财力也越来越巨大,人们相信这个领域一定是未来的一个趋势。作为虚拟现实领域最重要的技术之一,手势识别再一次被推上了风口浪尖。本文选择基于Kinect设备作为研究手势识别的切入点。本文介绍了国内外专家在手势识别领域的研究现状,以及本文研究的主要内容和目的。同时介绍了本文主要使用的开发工具、数据流以及坐标转换方法等。手势分析是进行手势识别前比较重要的一个环节,手势分析又包括手势预处理和提取手势特征值两部分。本文手势预处理包括的内容有图像的分割和优化。提取手势特征值的主要工作是提取掌心位置坐标、手势轮廓和指尖坐标等。本文手势的掌心位置坐标是通过线性扫描来定位,手势轮廓使用Moore Neighborhood算法进行提取。指尖坐标是手势特征值中最重要的特征值,也是本文主要研究的部分。本文首次将线性扫描算法应用到指尖定位中,并通过与经典的Graham Scan算法定位指尖进行了大量的对比实验,得出的结论是:在识别率略微降低的情况下,可以大幅缩短其识别所需时间。本文还将线性扫描算法与Graham Scan算法组合在一起,通过线性扫描算法对手势进行一次过滤,若识别失败再通过Graham Scan算法再次提取指尖特征值进行二次手势识别。并与Graham Scan算法进行了大量对比实验,得出的结论是组合法在平均识别速率和识别准确率上都高于Graham Scan算法。为了体现组合法的实用性,本文将其应用到手势控制鼠标应用程序中,通过不同手势来模拟常规鼠标所有的功能,并在实时性和识别率上都表现出不错的效果。