基于视频的非特定人动态手语识别算法

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:yymmttjjjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随计算机技术的迅猛发展,“以人为核心”的人机交互成为当前研究的热点。尤其是基于计算机视觉手势识别的研究,因其符合人的自然习惯且设备价格低廉,受到越来越多的关注。同时,手语是聋哑人以手势信息取代有声语言进行交流的重要方式。由于健全人一般不懂手语,而且手语翻译属于新兴职业,尚无法满足市场需求,因此手语识别的研究就显得十分有意义。面向未来智慧社区中手语/语音双向识别系统,实现聋哑人与健全人之间的可视“对讲”,不仅需要建立针对非特定人群的手语识别,还需要满足系统的实时性需求。为了有效解决上述问题,本文对手语识别中现有算法进行深入研究,并在此基础上对其中的两种算法进行改进,主要完成以下两个方面的工作。1)针对实时、大词汇集、连续手语视频的准确识别问题,提出一种融合压缩感知与加速稳健特征(Speeded Up Robust Features,SURF)的手语关键帧提取算法。首先在前期预处理阶段,采用基于HSV空间自适应颜色检测的方法来提取手势区域;再利用压缩感知将手语视频降维成低维多尺度帧图像特征,通过自适应阈值完成子镜头分割,处理大量手语帧数据;之后再运用SURF特征完成特征匹配,绘制SURF特征的帧间相似度曲线寻找极值点,最终提取关键帧。通过实验验证,算法具备处理大量复杂数据的能力,识别结果更加准确。2)针对跟踪学习检测(Tracking-Learning-Detection,TLD)算法在光照变化不均、遮挡严重、跟踪目标模糊等情况下会出现跟踪失败的问题,提出一种基于卷积神经网络优化TLD运动手势跟踪算法。首先选取手势特征作正样本,其背景作负样本,获取手势方向梯度直方图(Histogram of Oriented Gradient,HOG)特征并借助卷积神经网络加以训练,得到手势检测分类器,从而确定目标手势区域,实现手势的自动识别;再利用TLD算法对手势进行跟踪与学习,对正负样本进行估计检测并实时校正,同时运用SURF特征匹配更新跟踪器。实验表明,本文算法的跟踪精度高于传统TLD算法,且拥有更高的鲁棒性。
其他文献
高速重载试验车摩擦片在抱轨制动过程产生的温度场是影响其安全运行的关键因素。基于某高速重载制动试验,采用传热学相关知识和有限元数值模拟技术,确定了制动过程中摩擦片热
玻纤污泥作为玻纤工业废水处理的副产物,与生活污泥相比其成分和性质更为复杂,含有生产废水中的化学成分,属于危废类。高含水率的玻纤污泥会增加运输成本以及造成后续处置和
自然的人机交互方式一直是人们追求的目标,国内外对手势识别的研究一直没有停止过。微软研究的Kinect设备的问世,掀起了人们基于Kinect设备研究手势识别的新热潮。而且近年来
随着多边贸易体系的深入发展,全球性贸易谈判难度增大,许多国家和地区倾向于以区域贸易协定的方式来加快关税减让步伐和扩大市场准入范围。伴随着区域经济一体化程度的加深,
我校在基础课实验室评估之后,认真总结经验,并结合学校实际工作,提出了持续实验室建设与发展对策探讨,以全面推进实验室工作改革与发展.
户外活动是幼儿园教学活动的组成部分之一,能够调动幼儿参加体育锻炼的积极性,提高其对环境的适应能力,对幼儿的身心健康发展具有积极作用。但从实际情况来看,由于受到各方面