论文部分内容阅读
随着传感器技术的进步,人体运动捕捉技术日益成熟,并在动画制作、保健、医疗诊断、运动分析、机器人控制、真实场景游戏,甚至家庭娱乐等领域中得到成功的应用。经过三十几年的发展,逐步积累而成的运动捕捉数据库更是为运动捕捉技术的研究与重用提供了良好的支持。然而,由于运动捕捉数据具有维度高数据量大的特点,因此如何迅速且准确地从大型的人体运动捕捉数据库中检索出所需要的运动序列成为了人体运动捕捉领域中亟待解决的问题之一。对人体运动捕捉数据进行检索主要有两种形式:基于语义描述的检索和基于运动样本的检索。基于语义描述的检索是指用户采用一段文字来描述需要的检索的运动,系统根据文字描述从数据库中检索出与待检索运动在语义上最为相关的运动。基于运动样本的检索是指用户可以采用一段运动捕捉片段来描述有待检索的运动。系统根据待检索的运动片段本身所包含的数值信息,从数据库中检索出数值上最为相近的运动序列。为了解决基于语义描述的检索问题,本文采用条件随机场方法,对运动捕捉序列进行语义标注。条件随机场包括两个过程:训练过程和标记过程。在训练过程中,仅需做出高层语义的标注,如“走”、“跑”、“跳”等。训练时,用K-均值方法从训练样本中提取特征,并用提取出的特征构建CRF中的特征函数。经过训练的条件随机场可用来标注未知序列,从而得到该序列的高层语义特征,有利于进一步的索引建立。实验结果表明,在选取了合适的训练集合及参数的情况下,本方法可以正确和全面地在未知长序列中标记出训练集合中所含有的语义特征。为了解决基于运动样本的检索问题,本文提出了一种通过维度熵的降序排列构造的符号图模型。首先通过类似拉班舞谱的空间分割法将M维时间序列数据转化为K维的符号序列。然后将维度按照信息熵进行降序排列并构建层次结构的符号状态转换图。则检索问题转化为求符号图上一条路径所经过的各个节点所代表集合的交集。实验结果表明符号图模型是一种有效的索引方法。