智能人机交互中的人脸特征定位与人体运动识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:luoxuefubai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术在智能化方向快速发展,越来越多的通用软件使用了智能交互技术作为新型交互手段,而当前科技领域应用最广泛的智能交互技术当属人脸识别、表情识别、人脸动画、人体行为分析、行为语义化等内容。人脸特征定位和人体运动识别作为这些技术的基础支撑技术,近十年也得到了广泛研究和快速发展。人脸特征定位是指在人脸图像上计算出一系列预定义的位置,人体运动识别是指通过对人体运动数据进行统计分析,进而得到运动序列的分类和预测结果。近年来人脸特征定位和人体运动识别都取得了大量的成果,并在一定条件下定位精度和识别精度均达到较高水准。然而大量实验证明,现有的算法在自然条件下的定位精度和识别精度都尚未达到实用水平,无法提供自然人机交互时需要的高效精确的分析能力。因此,本文针对现有方法存在的问题展开研究,为人脸特征定位和人体运动识别相关的应用提供高性能方法,进一步提高人机交互的智能性。  现有人脸特征定位方法主要面临的问题:一是成像条件多样性,人脸外观变化高度非线性,缺乏良好的非线性人脸外观理论模型。二是对初始外形依赖严重,算法对遮挡,大形变等问题不鲁棒。人体运动识别方法主要面临的问题:一是运动表示方法众多,简单运动表示方法蕴含信息量不足,运动识别困难;复杂运动表示方法蕴含信息量大但计算量也大,运动识别效率低下。二是现有运动表示区分度差,同一个部位的运动可能存在多个不同表示,而弥补运动确定性,往往需要额外的运动描述信息,最终导致算法复杂度增加,影响识别率。  针对上述困难,本文着重研究了人脸特征的局部外观和整体外观模型的建立、人脸特征定位中的外形初始化以及人体运动识别中的运动表示等问题。并针对这三个问题提出了三个方面的解决方案:  1.提出一种基于全局特征和局部特征结合的级联人脸特征定位方法。  针对自然条件下的人脸特征定位应用存在遮挡,大形变等因素,设计了一种局部特征回归和全局特征回归交替进行的框架算法,该框架算法的执行分为两个阶段。第一阶段,需要在人脸图像的局部区域提取具有高区分度的局部特征训练随机森林,然后根据局部特征在随机森林中叶子节点的位置进行直方图统计形成图像特征编码,最后使用特征编码和样本的真实值求解线性回归矩阵并使用该矩阵进行外形增量计算。第二阶段,在第一阶段计算出的人脸外形区域产生全局特征,并通过计算选择出与当前人脸外形相关度最大的几对全局特征用于随机蕨的训练,然后使用训练好的随机蕨估计出外形增量。该算法有效的降低遮挡情况下局部外形回归误差对人脸外形估计产生的不良影响,同时也具备局部外形回归描述细节的能力。  2.提出一种基于后验概率的人脸初始化方法。  提出一种从现有的真实样本空间中找到与当前外形最贴近外形的线性组合作为初始值的方法。该方法寻找初始外形的过程包括以下步骤:第一,使用全局特征对样本集进行分类,分类结果在直观上的表现倾向于头部姿态或者朝向的分类。第二,对任意测试图像,进行一次分类并确定对应人脸类别,然后根据当前人脸类别中的样本和概率分布确定估计外形,并计算外形中心。第三,通过计算外形中心和图像信息确定对应的后验概率分布的参数,最后使用级联回归方法对人脸特征点进行定位。这种方法能有效的寻找到与当前人脸外形最贴切的外形组合作为初始外形,提高了人脸特征定位的精度并且有效降低外形定位的迭代次数。  3.提出一种基于李群理论的人体运动表达方法。  由于传统的运动表示方法存在相对几何与骨骼运动信息对应不确定的问题,提出了一种基于正交群的相对几何表示方法,该方法有效的排除相对几何在骨骼运动信息表示的多义性。并且论文从理论上证明了这种表示方法具有优秀的运动映射关系,能为骨骼运动与相对几何之间建立几乎是双射的映射关系,大大提高了运动特征编码的效率,同时也去掉了大量的冗余信息,有助于运动识别率的提高。  最后,本文在不同的人脸数据集和人体运动数据集上进行了实验,通过对实验结果的对比分析,可以看出本文算法在人脸特征定位和运动识别上均有不错的性能。
其他文献
[摘 要] 财经应用文写作课程目前存在的问题:一是课程设置过于靠前,二是教材体例缺少内部结构的联系性,三是讲授过程中缺少学生参与环节,四是一些文种数据运用被忽略,五是财经应用文写作没有明确的指向。解决问题对策建议是:课程在大三下学期开设与按照国民经济发展计划及项目时段、项目推进的次序与实际财经应用应该出现的时间顺序来安排文种体例,创新教学流程,导入学生参与,利用多媒体教学,围绕“5w”促进理论与实
近年来,计算机视觉在图像理解方面取得了卓越的进展,尤其是在图像识别、物体识别和定位等方面。而现在还缺乏有效的方法理解图像的形状、材质和环境的光照分布等更复杂的图像
随着通信技术的快速发展,作为新一代智能交通系统技术的车路协同受到越来越多的关注。毋庸置疑,车载自组织网络(Vehicular Ad Hoc Networks,VANET,简称车载网)是未来车路协同
情感识别是以人为中心对人类情感认知的研究,也是模式识别、情感计算、心理学、机器视觉等研究领域的一个极富挑战性的交叉学科课题,是近年来人工智能领域的研究热点。情感识别
随着信息技术的发展和普及,互联网逐渐成为一种计算平台。基于互联网平台的应用普遍是一种分布协同的过程。流程在这一协同过程中起着重要作用。目前互联网应用所面临的客户
随着计算机技术及电子商务的发展,越来越多的个人及单位参与到互联网当中,使得网络安全问题日益凸显。网络环境的复杂化导致传统的被动的防御方式在对计算机进行安全防护时显
相比于传统的固定式水质监测模式,全天候水质检测系统将无人机平台与检水装置有效结合,实现远程、高效的检水作业,具备环境适应能力强、机动安全等众多优势。但是在现有技术下,无人机数据通信安全问题逐渐暴露,特别是在军队卫勤保障过程中,飞行控制程序与水质监测数据安全性无法得到充分保障,已成为装备开发和使用中的潜在威胁。为解决上述问题,本研究设计了一种水质监测无人机的加密控制方案。该方案主要通过加解密单元实现