基于射影不变量的视角无关动作识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liupen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉中重要问题,并应用到很多方向,例如人机交互,视频标注和基于内容的检索等。虽然动作识别已经取得了很多重大突破,但是仍然面对很多巨大的挑战。例如:动作对齐,关键帧提取,以及视角变形。本文主要工作是利用射影不变量解决视角变化的动作识别问题,目标是保证不同视角下的动作可以正确识别。根据动作分析内容不同可以分成两类:基于关键点的动作识别和基于剪影的动作识别。对于基于关键点的动作识别,本文利用已有的特征数不变量,分别提出时间域和空间域下的两种动作表示方法,分别为时间特征数和空间特征数。特征数是一种新型的射影不变量,由于其适用在任意维度空间的不共面情况,所以可以保证完全的视角不变性。时间特征数适合于动作序列较长,但是跟踪点较少的情况;而空间特征数适合于动作序列较短,但是包括多个人体跟踪点信息的情景。这两种方法具有一定的互补性。基于剪影的动作识别是通过提取人体动作的外轮廓,将动作识别问题转换成形状识别。本文提出一种层次化射影不变量上下文算法。对于每个轮廓点,使用一种从粗到细的描述方式计算射影不变量,保证特征的视角不变性。根据使用不变量特征的不同,分别提出了层次化交比上下文和层次化特征数上下文。另外,为了体现形状的强区分性信息,本文提出一种轮廓分段上下文形状描述子,以轮廓段为基本单元,计算段之间的相似度。为了结合上面两类方法的各自优势,本文提出将它们进行特征融合,使融合特征既能具备最基本的区分性,又能保证视角不变性。最后通过多个国际公用数据库来验证和分析本文算法的有效性。时间特征数和空间特征数优于其他传统的不变量方法,但是易受噪声影响。层次化射影不变量上下文对动作视角变化比较稳定性,而且具有较强的抗噪声能力。并且,与轮廓分段上下文相结合可以进一步提高识别效果。
其他文献
随着计算机辅助设计(CAD)的迅速发展,现代工业生产设计已渐渐离不开计算机辅助几何设计技术(CAGD)的理论支持和应用。作为计算机辅助几何设计领域中一个重要方面,参数插值曲
增强现实是近年来一直受到追捧的一个研究热点,可以将一个真实场景中不存在的物体通过计算机生成虚拟图像,叠加到真实存在的场景图像中,虚拟信息与现实世界的完美融合,创造出
流体模拟被广泛应用于电影动画特效、工业设计等领域,从早期的高度场方法到近年来流行的基于物理的模拟方法,流体模拟方法迅速发展。流体模拟涉及内容广泛,除了常见的烟雾、水流
古语云,“秀才不出门,全知天下事”,意思是学识渊博的人,即使不出门,也清楚的知道外面的世界所发生的事情。在遥远的过去,此言犹如痴人说梦。然而科技的发展一日千里。计算机
最近几年,在传感器领域、电子信息领域中,数据量每天以很大的规模增长,其中科学界可以从这些大规模的数据量中提取很多有用的信息,并用这些信息智能决策很多问题。怎样从获得的源
随着信息化的快速发展,出现了一种现象:虽然应用系统在增多但是信息共享的程度却并没有相应的增大,出现这种现象的原因在于系统之间没有提供共享的调用接口。因为这些系统是在
随着我国核技术、核工业和建设行业的迅速发展,环境放射性污染对环境保护、公众安全的影响增加,其逐渐被民众重视。为有效减少放射性核素的危害,建立辐射环境监测系统对区域
复杂网络通常具有内部链接紧密,外部链接稀疏的特性,探索复杂网络社区发现方法对分析论文引用网络、万维网、蛋白质交互网络和交通网络等具有重要意义。复杂网络节点间不仅存在
近年来,随着互联网技术和网络信息检索技术的不断发展,尤其许多应用面临数据量呈几何级快速增长,并且数据维度也逐渐变高。那么,如何高效地处理海量高维数据的k近邻(k-Neares
随着现代科技的不断发展,图形处理硬件设备的性价比不断提高,几何造型软件大量普及,3D模型在不同领域得到了广泛应用。数字几何技术已成为新一代媒体,而3D模型技术正是数字几何技