论文部分内容阅读
传统的人机交互局限于键盘、鼠标和操纵杆的应用,在界面的友好性和自然性上已经不能满足人们的要求。基于视觉的手势交互利用摄像头获取人手运动的图像序列,通过提取手部特征,识别手势和手指运动轨迹,并作出相应的回应实现人与计算机交互。该技术融合了图像处理、机器视觉和模式识别等学科的相关技术,是目前研究的一个热点。另外,基于手势的交互在手语识别、游戏控制、智能家居等领域都有着非常广阔的应用前景。指尖的检测与提取是基于手指交互系统的关键。目前,国内外很多学者已经提出了很多方法用于指尖的检测,但几乎没有算法能够适应全部的场景。背景的动态多样性和指尖运动的随机性等特点,使得指尖的精确定位仍然是一项非常有挑战性的工作。指尖检测属于运动目标检测范畴,而运动信息和肤色信息是其中两个非常重要的特征。本文深入研究了基于肤色的检测、基于背景消减和帧间差分的目标分割方法,并将各种算法在理论上和实验上都进行了对比:基于背景消减的方法重点在于背景模型的更新,是最简单有效的方法之一;帧差法的动态适应能力较强,在目标运动过慢时算法失效;肤色是人手区别于其他物体的特征,但对光照过于敏感。在此基础上,本文主要研究基于指尖形状特征的检测:基于区域分析(模板)和基于轮廓分析的方法。两种算法都是在目标分割的基础上进行,因此检测的精度与分割效果密切相关。基于区域的方法定义了一个指尖模板,通过匹配来实现指尖的检测,对前景区域中出现的空洞比较敏感;基于轮廓的方法通过比较曲率的大小来判断指尖的位置,阈值如设置不当,很容易将两个手指连接处物判为指尖。本文提出了基于改进的径向对称变换(Radial Symmetry Transform)的指尖检测算法,随后将变换所得的结果利用肤色进行判别,得到定位最终的指尖位置。由于直接在原始的图像序列上进行操作,不需要考虑目标的分割问题。改进后的径向对称变换算法对光照的鲁棒性大大增强,并且能够达到实时。实验结果表明,该方法用于指尖检测是有效可行的。