论文部分内容阅读
随着计算机和网络的迅速发展,人机交互已经是人们日常生活中的一个重要组成部分。旧有的键盘、鼠标等利用物理媒介进行人机交互的方式已经不能完全满足用户的需要。一些新型的人机交互方式逐渐成为研究的热点,如手势识别、语音识别、人脸识别等。将手势作为人机交互手段,相比其他交互方式更加自然,也更加直接,在智能系统、机器人控制、多媒体教学、娱乐游戏等领域拥有广泛的应用前景。本文研究的是单目视觉下利用手势识别方法进行虚拟输入。涉及到的领域包括图像分割、指尖检测、手势跟踪以及识别。所做的研究主要包括以下几个方面:1、在手势分割方面,研究了目前常见的肤色空间模型,分析了YCbCr颜色空间的优缺点,提出了结合肤色和运动信息的基于相邻帧的自适应高斯建模方法进行肤色检测,得到了较好的分割效果。2、在指尖检测方面,研究了基于曲率的指尖检测方法,利用K-余弦算法以及K-medoids聚类方法对指尖点进行筛选。对K-余弦算法提出了自适应计算K值的方法,提高了指尖候选点的选取精度,从而提高检测的准确性。3、在手势跟踪阶段,采用了经典的Camshift跟踪算法。由于CamShift是半自动的算法,需要初始化目标窗口。本文以张开的手掌作为起始动作,并将此手掌的区域作为初始化窗口传递给CamShift算法。4、在手势识别阶段,本文通过选取几个明显的特征值作为特征向量,利用模板匹配的方式进行分类识别,对于动态手势则采用简单的DTW方法进行识别。最后,本文对手势识别做了交互系统的实现,利用动态手势来控制Picasa中图片的浏览和操作,获得了较好的效果。