论文部分内容阅读
随着在机器人技术、视频监控、人机交互以及多媒体技术中的应用,动作识别已经成为计算机视觉领域中一个非常重要的领域,并提出了种类繁多的算法。本论文旨在进行对视频中的人体运动进行描述的研究,并采用Weizmann数据库中包含的均匀和静态背景的影片来实现。其中包括10种动作类:弯曲、跑步、散步、跳绳、顶、跳跃前进、原地跳跃、奔腾侧身、双手挥舞以及单手挥舞。每个视频中包含有一个人完成的单一定期动作。首先,为了使后期主要任务进行的更容易,我们会做一些前期处理方法。这些前处理的方法主要表现为运动目标检测、形态学处理和特征提取三个方面。场景中的运动目标检测根据当前图像与从图像序列中估计所得的背景图像相减获得。这种通过估计背景图像的方法是背景差分法领域中使用的许多功能强大的方法之一。这种背景差分方法分为两个步骤:背景建模与背景差分。静态背景下的背景建模法种类繁多,例如:高斯均值模型法、时空中值滤波、混合高斯模型、核密度估计、顺序核密度逼近图像共生变化、本征背景模型法等等......鉴于运行高斯均值方法的简单性、效果好、费时少和执行良好等特点,本论文采取其进行背景建模。背景模型建立完成后,前景图像即可通过对视频当前帧与所建立背景图像模型进行相减获得。然后,将采取降噪声和形态学通过对人体轮廓内空洞以及形状断开处进行处理,来增强检测到的人体轮廓。这主要建立在腐蚀、膨胀、开运算和闭运算四个步骤之上。特征提取阶段,通过对局部(Harris角点检测)和全局(轮廓检测)两方面特征进行提取研究。我们采取支持向量机(SVM)算法进行分类。一步特征提取之后,在当地(Harris法角点检测)和全球(轮廓检测)特征提取研究。最后,我们采用支持向量机(SVM)算法进行分类,支持向量机算法是统计学和计算机科学中常用概念,主要为的监督学习中的一类用于分类和回归分析相关方法。