基于多摄像头的手势识别研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:leux
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视觉计算技术的发展,基于手势识别的自然交互方式使人机交互进入新的阶段,弥补了传统交互方式的不足。现有的基于视觉的手势识别研究仍然存在着一些不足。例如,基于肤色进行手部提取的方法需要凭经验设置肤色的阈值;当于与脸发生遮挡时,如果没有对手与脸的位置进行跟踪,会丢失手的位置;要求手掌基本平行于摄像头,导致用户长时间手部弯曲而感到不舒适;利用面积变化来测量手掌与摄像头之间的距离,在手与摄像头距离较远的情况下误差较大。   本文设计了一套具有11个手势的小型手势词汇,结合静态与动态手势,具备光标定位和发送命令的功能。在手势跟踪部分,本文在YCrCb颜色空间建立了一种基于高斯分布的统计模型,通过对手部图像的采样统计,自动初始化手部的肤色参数和面积参数;本文还提出一种通过估算质心位置的方法,较好地解决手与脸遮挡时的位置跟踪问题。在手势识别部分,本文使用预定义规则对静态手势进行识别,并利用正交放置的两个摄像头协同工作,从两个视角观察得到手势特征,提高静态手势的区分度;动态手势是针对从两个视角观察到的手势动作的运动轨迹,分别建立一套离散型隐马尔可夫模型(HMM),在识别时有效综合两套模型的识别结果,实现对手势动作的三维运动轨迹的识别。   通过实验对比,验证了本文所提出的基于采样参数的自动初始化、解决手脸遮挡问题、以及多摄像头协同工作等方法的有效性。本文采集11种手势一共2200个动态于势视频作为HMM的训练与测试数据。   基于上述研究,本文设计并实现了一个手势识别系统G-Sense。G-Sense使用两个普通摄像头,利用Picasa照片浏览软件和一个拳击小游戏进行手势应用展示,以评估本文提出的手势识别方法的有效性。邀请了若干用户来试用系统,对手势设计和识别效果进行调查问卷,验证系统的可用性。
其他文献
手势作为一种自然直接的交流方式,是一种新型的人机交互模式。操作者只需要通过在设备之前形成手势,便可与计算机进行互动。目前手势识别的理论和技术发展并不成熟,该领域是
随着支持向量机的广泛应用,其在大数据集上训练效率问题以及通过参数优化提高其性能的问题受到人们的广泛关注,本文就这两个问题做了以下研究:首先提出了一种基于多核并行的支
随着互联网的发展,网络学习已成为一种重要的学习方式。越来越多的企业和组织都构建了自己网络资源库,给人们学习带来了丰富的信息和极大的便利。但是,随着网络学习资源数量
组卷问题是一个满足多重约束条件的多目标优化问题,运用传统的数学方法解决组卷问题十分困难,在自动组卷的过程中,组卷系统的效率和生成试卷的质量主要取决于组卷算法的设计
随着信息技术的快速发展,工业控制系统已进入了网络化、智能化时代。无线网络技术逐渐发展成熟并开始进入工业自动化领域,使得工业控制系统的投资成本和使用成本降低。在这种
爆炸式的数据增长对存储服务和存储空间的要求越来越高,许多分布式存储系统运营商投入大量资金购买存储设备,使得系统运行和维护的成本大大增加。然而,网络上很多开放的网络
视频监控数字化、网络化的时代已经到来,监控点的部署变得灵活、分散,监控系统呈现分布式的架构,传统的集中式智能视频分析的解决方案已经不适用,本文应用网格技术构建分布式
互联网时代的信息大爆炸,大量重复无意义的数据充斥在互联网中,人们很难有效的获取需要的知识信息。而随着移动互联网的普及,人们对信息的渴求更加的强烈,虽然搜索引擎可以帮
信息化是社会进步的重要手段之一。当前以计算机技术,通讯技术和网络技术为代表的现代信息技术,使人类对信息资源的利用进入了高效、专业化、多样化、共享化的现代阶段。信息
随着机器学习理论在指纹识别、图像检索、信用分析、网页推荐等数据分析和数据挖掘领域中的广泛应用,主动学习已经成为模式识别和机器学习中的重要研究领域,并且在理论和实际