论文部分内容阅读
近年来,随着运动捕捉技术的快速发展,基于捕获数据的人体运动的相关问题的研究逐步到人们的重视与关注。运动捕捉技术的进步使得人们可以轻易地获取大量高质量的捕获数据,这些数据一方面可以还原复现人体动作;另一方面是对这些人体动作捕获数据的研究,可以帮助人们在虚拟现实、医疗康复、游戏场景、军事演习以及影视制作等诸多领域取得更大的发展空间。本文论文的研究主要包括基于捕获数据的人体动作评估以及人体动作的分割这两大问题。基于捕获数据的人体动作评估是指借助捕获数据,判断与某一标准动作的相似性,既包括整体宏观动作的相似性,也包括局部肢体动作的相似性。动作评估的目的在于给出两个动作之间的相似性,尤其是一个任意动作与标准动作之间的相似性。另外,动作评估也可以为动作分类算法提供动作相似度度量。而基于捕获数据人体动作分割问题是指从连续的人体运动捕获数据中准确截取出若干具有独立语义意义的动作的片段,如击球、跳跃、奔跑等动作。有效的人体动作分割算法可以有助于捕获数据的复用和编辑。在基于捕获数据的人体动作评估部分,提出基于GRU的人体动作分类模型,其对基于LSTM的人体动作分类模型在数据、特征、模型三个方面作出改进,提高了模型的准确性、效率以及泛化能力。在数据方面,通过多种数据增强机制对原有数据扩充,增加了学习样本的数量。在特征方面,用多个网络对人体各个主干部门提取特征,代替原来的对全部关节单一模型的特征提取。这样除了可以评语整个动作的相似性外,还以评估身体特定部位的相似性。在模型方面,GRU代替LSTM,极大地降低了训练时间同时不影响预测结果的准确性。这三个方面的改进,可以在提高人体动作分类模型拟合能力的同时既提高了对未知动作序列样本的预测能力,又降低了分类模型训练及预测的时间。在基于捕获数据人体动作分割部分,提出了两种方案,一种是在分类模型的基础上,对一定时间段内的动作分类,动作类别发生变化时,确定分割点。再具体实现上,分成两方式:一种方式是简单的滑动窗口,设定窗口大小后,对窗口以特定步长向前移动;另一种方式是建议窗口,这种方式可以根据当前窗口的特征确定下一个窗口需要向前移动的距离另一种方案,是采用CTC的思想,将分割问题转化为序列的标注问题。CTC可以自动地确定分割点,免去了人为对样本的标注。本文用人体动作捕获数据库HDM05进行实验来验证我们所用的两种分类方法,在评估分类问题上,在训练集和测试集上分别达到了98.94%和95.98%的分类准确率。在动作分割问题上,我们采用基于帧的准确率,最好的平均分割准确率为69.41%。