基于单目视频序列的二维全身人体姿态估计的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wb5019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像、视频生成工具的不断普及,图像、视频的数量呈现爆炸式增长,单纯的依靠人力获取图像、视频中的信息已经不能满足实际的需求。近年来人们对图像以及视频的智能分析、识别的需求越来越大。而如何通过算法自动分析、计算、识别图像以及视频中的信息成为研究的热点。最近10年人体姿态估计作为计算机视觉的子领域吸引了广大研究者的关注。人体姿态估计在现实环境中拥有广泛的潜在应用:动作识别,安全监测,动画生成等。人体姿态估计的研究重点有:表示图像或视频的信息的特征描述符的选择;关节或者人体主要的部位的定位方式;姿态估计方法的选取,基于模型的方法还是基于机器学习的方法。近几年,研究者更多的关注基于单帧静态图像的人体姿态估计的研究,基于视频的人体姿态估计的研究比较少,尤其是基于单目视频序列。但是基于单目视频序列的全身人体姿态估计拥有广大的潜在应用需求。本文主要研究基于单目视频序列的二维全身人体姿态估计。首先,对于视频序列中的每一帧图像我们使用了基于方向梯度直方图为特征向量的线性支持向量机分类算法检测出人体区域,然后在检测区域使用基于最小二乘法的多维迭代回归算法估计出二维全身人体姿态。在研究中,我们根据人体的关节结构构造了全身关节关系树,关系树将人体的全身姿态估计分解为多个局部姿态估计,提高了估计的准确性。在学习训练阶段,对于关节关系树中每一条边训练一个多维迭代回归映射模型,并且采用空间和时间维度相结合的特征作为学习的输入特征向量,关节关系树中父子节点之间的归一化偏移量作为目标特征向量。我们使用方向梯度直方图作为空间特征向量。并且通过引入光流场和帧间差分与方向梯度直方图整合成运动特征来提高姿态估计的性能。根据关节关系树结构,最终我们训练了一个层级回归映射模型。测试阶段,我们使用训练获得的层级回归映射模型估计出人体所有的关节位置。由测试结果可知,我们提出的基于单目视频序列的二维全身人体姿态估计方法取的了不错的估计效果。
其他文献
现场总线技术、嵌入式技术和电子技术的快速发展,为我国矿井生产自动化的跨越式发展提供了契机。基于现场总线的矿井自动化系统,不仅成本低、监控能力强,而且现场设备的智能
随着对计算机速度要求的不断提高,大规模并行计算机系统中的计算节点数不断增加,传统的电互连网络产生了一系列的问题,如带宽低,延迟高,能耗高等。本文首先分析了电互连网络
随着计算机技术,通信技术和电子技术的大力发展,人类社会已经进入了数字化时代。多媒体技术的数字化使得人们的生活变得更加丰富多彩。视频压缩又是数字多媒体技术的核心技术
会话初始化协议(SIP)是由IETF提出的信令协议,近年来发展成为下一代网络(NGN)和3G中的核心协议之一。本文研究的内容是SIP的安全性问题。文中首先对SIP进行了介绍,并详细讨论
中国自主知识产权的TD-SCDMA无线移动网络已在国内部分城市大规模建设,网络规划优化质量影响到网络建设的成本和运营性能,而网络规划优化软件的优劣与网络规划优化质量息息相
ALPHA-STABLE分布在现实生活中大量存在,目前它是国际上研究比较热门的课题之一,由于ALPHA-STABLE分布很好的描述了现实世界中数据的分布,它逐渐被应用到各种领域,性质也越来
色彩管理技术近几年得到迅猛发展,分光测色仪则是色彩管理中不可或缺的高精度颜色测量设备。目前,动态分光测色仪技术还存在测量速度慢、成本高、与现有先进技术脱节等缺陷,
Web Service技术是目前企业应用集成领域的主流技术。它提供一种一致编程模型,从而在企业信息系统内外都可以利用通用的基础设施,并可采用通用的、增量的方式进行应用程序集成
随着多媒体技术和CG技术的发展,渲染引擎在电影动画、模拟仿真、游戏特效等方面具有越来越广泛的应用。主流渲染引擎无一例外都非常重视光线追踪算法在渲染系统中的重要作用,
无线传感器网络WSN(Wireless Sensor Networks)是继因特网之后,将对二十一世纪人类生活方式产生重大影响的IT热点技术,在军事、工业、民用等领域有巨大的应用价值和前景。无