静态图像中的人体姿态估计研究

来源 :长沙理工大学 | 被引量 : 1次 | 上传用户:feya520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
静态图像中的人体姿态估计是给定检测图像后根据行人检测的结果确定人体不同部件的位置并得出方向、尺度信息,是后续行为理解的基础。由于人体自身的灵活性加上背景的复杂性,使得人体姿态估计问题极具挑战性。常用的特征有形状特征和方向梯度直方图(Histogram of Oriented Gradient,HOG)。人的形状特征会随着姿态的变化而不断改变,又容易受到服饰的影响,而HOG特征计算复杂。对于一幅图像,事先并不知道部件的位置,加上人体的姿态千变万化,所能采取的姿态极多,使得姿态搜索空间非常大。为了解决部件特征提取和姿态所搜索空间过大问题,本文的主要创新成果有:1.针对模型本身在部件特征表达上的不足限制了姿态估计结果准确度的问题,提出了一种基于图结构模型(Pictorial Structure,PS)和新型纹理特征的人体姿态估计算法。采用改进后的外观模型,训练获得部件位置的先验知识,联系相邻部件之间的配合关系,并将其应用于测试图像的外观模型建模阶段。应用Haar型LBP(HLBP)纹理特征,提取部件的纹理信息,对图像进行分块处理,并为每一块赋予不同的权重。实验结果表明,带权重的HLBP(Weighted HLBP,WHLBP)特征能更有效提取部件的纹理特征,与HLBP特征、归一化HLBP特征和颜色特征相比能获得更高的准确度。2.针对姿态估计过程中姿态搜索空间过大的问题,提出了一种基于简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)超像素算法的Grab cut减小姿态搜索空间算法。以行人检测矩形框作为输入,用SLIC算法分割得到超像素并用超像素作为s-t图中的节点构建图模型,分别为前景和背景超像素建立混合高斯模型(Gaussian Mixture Model),迭代更新高斯参数,用最小割算法完成图像前景提取。后续的姿态估计过程仅在得到的前景区域中进行。实验结果表明,基于SLIC的Grab cut算法与基于Grab cut算法的减小姿态搜索空间算法相比在运行时间上和姿态估计准确度上均有较大程度提升。综上所述,本文在静态图像的人体姿态估计任务中的两点创新具有优异的性能。对彩色图像分块提取纹理信息,根据特征值的大小设置不同的权重,致力于解决部件特征提取问题。同时为了尽可能的减小姿态搜索空间,通过超像素分割算法将姿态推断局限于小面积的前景区域,能同时提高运行速度和姿态估计准确度。
其他文献
随着数字信息的膨胀,大量可用的数字信息对于回答用户的各种问题变成了可利用的资源。传统的信息检索通常会对用户的提问返回成百上千篇文档,而用户必须依靠自己在这些繁多而
在快速扩散制造模式多企业环境中,由于扩散产品故障信息的分布性和异构性,对产品进行故障诊断非常困难,并且在传统的故障诊断服务中工程技术人员到故障现场由于技术和经验等原因
伴随着网络和数字视频技术的飞速发展,监控技术正向着智能化、网络化方向不断前进。智能视频监控是计算机视觉领域一个新兴的应用方向,智能视频监控是在不需要人为干预情况下
自从网络诞生以来,各种各样的安全问题也随之层出不穷。对于现今对网络无比依赖的众多企业用户来说,安全始终是高悬在应用上的一把“利剑”。如何为用户打造一个全面的安全体
人脸识别技术因其具有重要的科学意义和实用价值,在近几年得到了研究者的高度重视,成为当前模式识别和人工智能领域的一个研究热点。但由于年龄变化引起人脸形状和纹理上的变
视频会议系统是指通过现有的各种电气通讯传输媒体,将人物的静、动态图像、语音、文字、图片等多种资料分送到各个用户的计算机上,使得在地理上分散的用户可以共聚一处,通过
用户以社会化媒体(Web2.0的媒体)的方式获取更加多样化的信息,作为信息的主要发布者用户,通过发布感兴趣的某些方面的信息给用户建立社会联系,在直接交互的用户之间建立自己
遗传算法作为一种基于自然选择和遗传理论的通用优化算法,已成功应用于组合优化、机器学习、工程优化、图象处理、人工生命、自动程序设计等诸多领域。随着研究的不断深入,遗
三维图形主要是通过三维建模软件创作或者通过三维扫描仪进行扫描来获取的。如果用三维建模软件制作复杂的三维模型,则需要较熟练的技能以及细致耐心的操作,是耗时、费力和繁复
电子商务的发展,需要安全性好同时效率高的电子支付方式来支持。目前主要被采用的SSL协议和SET协议虽然都有优点,但各自缺点明显,已经成为电子商务进一步发展的瓶颈。如何优