论文部分内容阅读
随着人机交互技术在智能化方向快速发展,越来越多的通用软件使用了智能交互技术作为新型交互手段,而当前科技领域应用最广泛的智能交互技术当属人脸识别、表情识别、人脸动画、人体行为分析、行为语义化等内容。人脸特征定位和人体运动识别作为这些技术的基础支撑技术,近十年也得到了广泛研究和快速发展。人脸特征定位是指在人脸图像上计算出一系列预定义的位置,人体运动识别是指通过对人体运动数据进行统计分析,进而得到运动序列的分类和预测结果。近年来人脸特征定位和人体运动识别都取得了大量的成果,并在一定条件下定位精度和识别精度均达到较高水准。然而大量实验证明,现有的算法在自然条件下的定位精度和识别精度都尚未达到实用水平,无法提供自然人机交互时需要的高效精确的分析能力。因此,本文针对现有方法存在的问题展开研究,为人脸特征定位和人体运动识别相关的应用提供高性能方法,进一步提高人机交互的智能性。 现有人脸特征定位方法主要面临的问题:一是成像条件多样性,人脸外观变化高度非线性,缺乏良好的非线性人脸外观理论模型。二是对初始外形依赖严重,算法对遮挡,大形变等问题不鲁棒。人体运动识别方法主要面临的问题:一是运动表示方法众多,简单运动表示方法蕴含信息量不足,运动识别困难;复杂运动表示方法蕴含信息量大但计算量也大,运动识别效率低下。二是现有运动表示区分度差,同一个部位的运动可能存在多个不同表示,而弥补运动确定性,往往需要额外的运动描述信息,最终导致算法复杂度增加,影响识别率。 针对上述困难,本文着重研究了人脸特征的局部外观和整体外观模型的建立、人脸特征定位中的外形初始化以及人体运动识别中的运动表示等问题。并针对这三个问题提出了三个方面的解决方案: 1.提出一种基于全局特征和局部特征结合的级联人脸特征定位方法。 针对自然条件下的人脸特征定位应用存在遮挡,大形变等因素,设计了一种局部特征回归和全局特征回归交替进行的框架算法,该框架算法的执行分为两个阶段。第一阶段,需要在人脸图像的局部区域提取具有高区分度的局部特征训练随机森林,然后根据局部特征在随机森林中叶子节点的位置进行直方图统计形成图像特征编码,最后使用特征编码和样本的真实值求解线性回归矩阵并使用该矩阵进行外形增量计算。第二阶段,在第一阶段计算出的人脸外形区域产生全局特征,并通过计算选择出与当前人脸外形相关度最大的几对全局特征用于随机蕨的训练,然后使用训练好的随机蕨估计出外形增量。该算法有效的降低遮挡情况下局部外形回归误差对人脸外形估计产生的不良影响,同时也具备局部外形回归描述细节的能力。 2.提出一种基于后验概率的人脸初始化方法。 提出一种从现有的真实样本空间中找到与当前外形最贴近外形的线性组合作为初始值的方法。该方法寻找初始外形的过程包括以下步骤:第一,使用全局特征对样本集进行分类,分类结果在直观上的表现倾向于头部姿态或者朝向的分类。第二,对任意测试图像,进行一次分类并确定对应人脸类别,然后根据当前人脸类别中的样本和概率分布确定估计外形,并计算外形中心。第三,通过计算外形中心和图像信息确定对应的后验概率分布的参数,最后使用级联回归方法对人脸特征点进行定位。这种方法能有效的寻找到与当前人脸外形最贴切的外形组合作为初始外形,提高了人脸特征定位的精度并且有效降低外形定位的迭代次数。 3.提出一种基于李群理论的人体运动表达方法。 由于传统的运动表示方法存在相对几何与骨骼运动信息对应不确定的问题,提出了一种基于正交群的相对几何表示方法,该方法有效的排除相对几何在骨骼运动信息表示的多义性。并且论文从理论上证明了这种表示方法具有优秀的运动映射关系,能为骨骼运动与相对几何之间建立几乎是双射的映射关系,大大提高了运动特征编码的效率,同时也去掉了大量的冗余信息,有助于运动识别率的提高。 最后,本文在不同的人脸数据集和人体运动数据集上进行了实验,通过对实验结果的对比分析,可以看出本文算法在人脸特征定位和运动识别上均有不错的性能。