基于TLD框架的手势检测与跟踪系统的研究与实现

来源 :武汉理工大学 | 被引量 : 5次 | 上传用户:guaodeshanying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,随着各种智能设备如手机、平板电脑、智能电视等的普及,人与计算机之间的交互活动越来成为人们日常生活中不可或缺的一个重要组成部分。自然人机交互系统充分利用了这些身体语言来进行人与机器之间的交互。其中,手势是很重要的一种手段。本文将尝试设计一个简单的基于视觉的手势交互系统原型,其最终目的是用人手模拟计算机鼠标的功能。该系统设计的关键功能是实时地跟踪并检测人手的位置、状态并输出结果。在计算机视觉领域,实时目标检测与跟踪是指在一个视频流(通常是由摄像机实时拍摄的画面)中跟踪一个或多个具有选定特征的目标的过程。目前,静止图像中目标检测(如人脸检测)的相应技术已经非常成熟,但是在运动场景中实时地捕捉目标却一直是一个比较艰难的课题。由于应用场景的复杂性,跟踪目标的多样性、以及对实时性和鲁棒性等的高要求,实时目标检测与跟踪数十年来一直是国内研究的热点。本文的主要研究了一种基于TLD框架的实时手势检测与跟踪系统,对手势检测,手势跟踪,在线学习等各个环节的误差优化等都进行了理论研究与测试,最后,在BeagleBoard嵌入式开发板上实现了一个简单的手势人机交互系统原型。具体而言,本文的主要工作如下:(1)结合TLD的跟踪框架,采用Lucas-Kanade金字塔算法计算光流,并针对该算法计算耗时的缺点,采用了一种改进的金字塔光流计算法,并结合前后两帧双向跟踪估计误差,降低了跟踪的错误率,使得光流法对像素点的跟踪更加可靠,有效地避免了跟踪中经常出现的漂移问题,并且在OpenCV下对图像匹配进行了测试。(2)针对当前各种模版匹配算法不能处理目标在视野中消失或部分被遮盖的问题,提出了采用一种基于图像局部小块集合的手势表示模型,采用随机蕨分类器做模版匹配,并结合在线学习实时更新模型,有效解决了在目标消失后无法重新跟踪或者当目标被部分遮盖时难以给出正确结果的困难。(3)设计了一个简单的手势人机交互系统原型,结合OMAP处理器的特点,将算法的处理过程平均分配给ARM核心和DSP核心,提高了处理速度,并最后测试了系统对手掌被遮盖、发生形变以及消失的应变能力。
其他文献
产品质量安全风险监管己成为新形势下政府监管机构面临的重要课题之一。近年来产品质量安全监管得到了政府和很多学者的关注,进行了大量的研究,并取得了一些有益的成果。就目前
星敏感器是一种高精度姿态敏感测量仪器,它以恒星为参照系,可提供准确的空间方位和基准,并且具有精度高、抗干扰性强、可不依赖其它系统进行独立导航等优点。星敏感器一般用于卫
随着计算机技术、通信技术以及互联网技术的飞速发展,社会信息化进程逐步加快。为满足新的全球范围内的数字化生存与竞争环境下,各国都将城市通卡建设列入了工作日程,建立城
随着3G移动互联网时代的来临和嵌入式硬件设备的不断发展,以Android手机操作系统为代表的移动智能终端设备逐渐成为了人们关注的热点。Android操作系统是基于开源Linux内核开
目的:子宫内膜癌是女性生殖道最常见的恶性肿瘤的,在美国约占妇科癌症的一半,在我国子宫内膜癌的发病率在女性恶性肿瘤中占第四位。近年来国内外研究数据显示子宫内膜癌的发病率
全基因组关联研究(genome-wide association study, GWAS)从2005年起初露锋芒,至今方兴未艾,成果斐然。然而,目前GWAS所识别的具有主效应的位点仅能解释一小部分遗传变异。复杂
“三农问题”是我国发展道路上必须解决的问题,农民增收则是问题解决的关键。农地作为农户手中仅有的几样资源,在农户增收中扮演者重要的角色。非农就业的增多,导致农地流转,
<正> FDH-4型傅声器放大器是一种用途极广的电声测量仪器.它有电表指示、高增益、低噪声和宽频带等特点,本文拟介绍仪器的主要性能和工作原理. 一、主要技术参数 1.频率范围:
目的:探索小儿清感灵片中黄芩药材的鉴别方法。方法:用薄层色谱法对方中黄芩药材进行定性鉴别。结果:薄层色谱斑点清晰,分离度好,阴性对照无干扰。结论:该法专属性强、准确度
在村庄规划实践中应采取适应村庄特点、而异于城市规划的方法,在拾村村的规划案例中,通过现状深入调研形成较完整的村庄认知,并且衔接上位规划导向,以面向村庄生产、生活、生