基于双摄像头的实时手势输入系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lifengjun001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势是一种自然、直观、易于学习的人机交互手段。利用计算机识别和解释手势输入是将手势应用于人机交互的关键前提。本文的手势的实时输入可以进一步分为两个步骤:对于已定义手势的识别及根据系统识别的手势完成输入。手势输入作为一种新型的人机交互技术,已经成为涉及图像处理、模式识别、计算机视觉等领域的一个比较活跃的课题。由于手势定义的灵活性、复杂性及不同手势之间的相似性、以及时间和空间上的差异性等特点,加之人手是复杂变形体,使得手势输入又是一个极富挑战性的多学科交叉的研究课题。本文源于国家863课题“基于手势的拟人化人机交互系统”,完成了双手的手势图像预处理、手势特征的提取、已输入手势的识别及对于输入法的控制输出,其中包括手势图像的切分。在图像的识别率和识别速度上都有一定的提高。在自然光照,实验室光照,复杂背景和简单背景下的识别情况进行了实验对比,较好的解决了在复杂背景下识别率较低的问题,并且光照条件不再局限在实验室光照条件下,自然光照条件下也能有较高的识别率。  本文设计并实现了基于双摄像头的实时手势输入系统,该系统能够实时地完成对于左右手的识别工作,并通过识别结果对输入法进行控制,在左右手交替输入的过程中提高了输入效率。本系统的完成主要包括四个步骤:首先,对摄像头捕捉的手势图像进行预处理:根据人体肤色特征从一帧图像中提取分割出手势区域,并对分割后的手势图像进行相应的增强、二值化及使用拉普拉斯边缘提取算法获取手势轮廓,再用白色填充手势区域;第二步是对手势图像进行特征提取:通过对多种特征及算法的比较,本文选取了包括手势几何特征,Zernike矩特征,傅里叶描述子共同描述的手势特征,并且取得了较好的效果;第三步进行手势识别:采用多层感知器进行手势的分类识别,由于采用单目视觉的方法,故实时性也较好;最后是对输入法的控制:将手势分为字母手势和操作控制手势,字母手势实现了连串的输入,操作控制手势实现对输入法的启动,输入信息的修改及完成。
其他文献
集成无线通信、嵌入式计算、传感器和分布式信息处理技术的无线传感器网络已经成为当前信息网络研究的热点,随着廉价的CMOS摄像头及微型麦克风的出现,以及人们对图像、音频和
对于一种逻辑(?),它在一类结构C上的模型检测问题是询问一个给定的(?)语句在一个给定的C结构中是否成立。核化是一个在设计固定参数算法中广泛应用的技术。核是一个从输入实
目前,图像编辑软件的广泛应用已经导致了许多非法的数字图像使用。在这种情况下,急需开发相关的计算机技术来验证数字图像的完整性,从而阻止对数字图像的恶意伪造。图像哈希是一
学位
多标记学习问题中每个样本可以同时和多个标记相关联,因此比传统的单标记学习有更广的应用空间,并受到越来越多研究者的关注。然而,多标记学习依旧存在着维度灾难、噪音特征
随着越来越多的用户愿意上网发微博,表达对公共事件的关注和看法、表达个人情感或情绪、报道新闻事件、发表观点等,微博已经成为非常有价值的数据源。如何有效地获取和展现微
V网伴侣(VPMN Partner)是一款面向企业用户的统一通信(Unified Communication)业务,并与传统的VPMN业务(virtual private mobile network,移动虚拟专网业务)融合。V网伴侣业
利用GPS载波相位进行载体姿态测量是近几年来新发展起来的一项GPS应用技术,具有全天候、精度高、无需对准、无累计误差、成本低等优点,正越来越多的应用于航天、航海等行业并逐
学位
随着互联网的普及,垃圾邮件的泛滥在严重干扰了人们的正常工作和生活的同时消耗了大量的带宽资源。传统的反垃圾邮件的方案例如设置过滤规则或者对邮件地址应用黑名单或白名
由于通信及网络技术的发展,网络数据呈现海量特征。如何从浩如烟海的信息数据中找到自己需要的信息,是目前亟待解决的一大问题。网页自动分类技术可以使信息组织更加条理,富有层
学位
零空闲流水线调度问题是一种典型的调度问题,它具有广泛的工程应用背景。和声搜索是最近出现的一种智能优化算法。与传统进化算法相比,具有结构简单、容易实现、数学理论要求