【摘 要】
:
人体行为识别作为计算机视觉和模式识别的热门研究方向,已经在人机交互、智能视频监控、运动分析和医疗辅助等诸多领域得到广泛地应用。人体行为识别是指从视频图像识别人体行为动作同时完成对人体目标的定位跟踪。近年来,大数据技术的发展推动了人体行为识别研究的进步。如何在采集少样本数据集的前提下,迅速获取视频图像中人体行为的信息,使视频数据成为可直接利用的信息资源,仍是需要我们研究的课题。本文在采集少量人体行为
论文部分内容阅读
人体行为识别作为计算机视觉和模式识别的热门研究方向,已经在人机交互、智能视频监控、运动分析和医疗辅助等诸多领域得到广泛地应用。人体行为识别是指从视频图像识别人体行为动作同时完成对人体目标的定位跟踪。近年来,大数据技术的发展推动了人体行为识别研究的进步。如何在采集少样本数据集的前提下,迅速获取视频图像中人体行为的信息,使视频数据成为可直接利用的信息资源,仍是需要我们研究的课题。本文在采集少量人体行为样本的条件下,实现了一个人体行为识别系统,所完成的工作主要有以下几个方面:(1)从人体局部特征入手,利用人体姿态识别方法、机器学习和目标跟踪相关技术,能够实时地识别单人、多人的人体行为动作并且定位跟踪人体目标。(2)采用人体姿态估计算法获得人体关键点位置,利用15个关键点的坐标,构造人体空间特征集合,包括3个子集:人体局部坐标特征描述子集、局部方向矢量特征描述子集和局部方向矢量特征描述子集。通过加权融合,构成人体行为局部描述子,完成人体行为动作特征提取。(3)依据中心极限定理和极大似然估计原理,设计人体行为数据生成器,产生大量相似样本,完成少样本数据增强,改善原始行为动作数据集样本量不足的情况。(4)利用机器学习相关技术构造多种人体行为分类算法,在本文的增强行为数据集上进行训练优化,对分类模型的性能指标进行比较,选择性能最优的分类模型完成人体行为分类。(5)通过人体姿态估计算法获得的关键点位置进行人体目标区域的定位,采用基于SORT改进的Deep SORT算法完成对人体目标的跟踪,对本文设计的人体行为识别系统在测试数据上进行性能测试,研究结果表明,该系统对5种行为动作,表现出了良好的识别效果和泛化能力。
其他文献
本文针对虚拟像平面相机模型的虚拟图像生成和光心定位等问题展开研究。首先研究虚拟图像生成问题,一般方法为k-NN方法,采用加权平均法求解像素点灰度值,本文提出了一种基于三角面片拟合的生成方法,以像素点坐标及其灰度值构成一个三维坐标系,将图像生成问题转换为在该坐标系下的局部曲面拟合问题,以像素点在曲面上的坐标值为其灰度值,从几何角度解释了像素点灰度值的物理含义。其次研究光心定位问题,一般方法为利用多幅
随着旋翼飞行器应用范围越来越广泛以及计算机视觉技术和人工智能技术的快速发展,越来越多的专家学者将旋翼飞行器作为载体与人工智能技术结合研究。飞行器视觉着陆技术作为一个飞行器智能化的关键技术受到了广泛关注,如何能够使飞行器更准确地降落在指定位置,需要展开进一步研究。本文选取四旋翼飞行器作为研究对象,对飞行器视觉着陆全过程展开了深刻的研究,包括地标与相应识别算法的设计、飞行器位姿估计方法的研究、着陆过程
火炮作为现代战争的常规武器对战场局势有着十分重要的作用,其中膛线作为火炮身管内壁上的关键结构,可以使弹丸旋转提高射程、精度和威力。在火炮使用过程中膛线会发生磨损,其磨损程度基本决定了火炮使用寿命,而在火炮生产过程中,膛线尺寸也是火炮身管是否合格的重要判断标准。因此如何实现火炮膛线的精准、快速、自动化测量,对于提高火炮的生产效率、保证射击准确度以及准确预估剩余使用寿命都有着至关重要的意义。目前国内膛
熔融沉积成型技术(FDM)是目前广泛采用的3D打印技术。为了进一步扩大这项技术的应用领域,人们开发了各种各样的打印线材。然而,打印制品的性能不仅仅取决于所使用的材料,还与熔丝的微观结构有关。本文仿造贝壳结构提出了一种新的合成打印线材的方法。采用喷涂工艺、横向剪切法和FDM打印技术实现控制打印样品中纳米填料的排列方向。首先研究了喷涂工艺对氧化石墨烯(GO)分布均匀性和密度的影响。研究表明:适当提高喷
3D人体姿态估计是在计算机视觉任务中最热门的研究领域之一,通过利用图像信息或视频信息来估计其中的人体关节点位置,并构成完整的人体姿态。随着科技水平的提高,对于人机交互的要求越来越高,可以产生图像信息的智能设备逐渐引入到人们日常生活中。所以,3D人体姿态估计任务具有很高的研究价值。近年来,深度神经网络在计算机视觉任务中有很多成功应用,其也成为了3D人体姿态估计任务的最佳选择。在3D人体姿态估计的研究
本文针对自然场景下的数字字符检测与识别问题,结合计算机视觉相关技术,将检测与识别问题分为区域提取和识别两个过程。具体的工作包含以下几个方面。将无监督特征表达用于自然场景下的数字字符检测问题。选取了K-means与Bo F无监督特征表达用于数字字符检测问题,设计了神经网络结构作为字符区域的判别器。通过滑动窗口法去判别并标记字符区域,最后利用字符区域提取算法筛选出最终的字符区域。通过实验比较了两种无监
近年来,随着互联网和计算机行业的飞速发展,游戏行业发展迅猛。新颖特色的游戏层出不穷,游戏娱乐已经成为现代年轻人生活的必需品,游戏逐渐融入到人们的日常生活当中。随着游戏行业的飞速发展,怎样开发游戏,怎样开发出更好的游戏,已经成为现代游戏开发行业深思的关键。游戏引擎成为了许多企业和开发团队的必要开发工具,其性能强大,方便使用,极大提升了开发者的研发效率,受到了广大游戏开发人员的好评,而Unity3D作
本文研究了选区激光熔化(Selective Laser Melting,SLM)成形TC4钛合金沉积态和热处理态显微组织的特征及其对断裂韧性和疲劳裂纹扩展速率的影响规律。结果表明:(1)沉积态的横截面显微组织表现为大量针状马氏体相α’和β相,纵截面表现为沿成形方向生长的粗大柱状晶,晶内针状马氏体α’相与成形方向呈45°夹角。热处理后,针状α’相转变为板条α相,形成α+β的板条组织。(2)随着热处理
传统搜索引擎是用户检索信息的重要渠道,用户输入问题返回网页集合,需要用户自己快速浏览网页定位到答案的具体位置,整个过程费时费力。基于自然语言处理技术的问答系统是传统搜索引擎的重要改进方向,能够快速获取答案,节省用户时间。和基于知识图谱等结构化问答系统相比,非结构化文本数据规模庞大且较易获取。目前开放式的基于非结构化文本的问答系统技术发展还不够成熟,专业领域的问答系统较少,因此基于限定域非结构化文本
基于计算机视觉的多目标检测技术作为一种智能而便捷的监测手段,在无人驾驶、城市安全等领域中的应用越来越广泛。野外复杂环境下的多目标图像检测技术作为计算机视觉领域中的难题之一,它包含了模式识别、人工智能、数字图像处理等其他关键技术。但是,由于野外环境具有复杂多变、差异性较大、与目标易混淆,目标易受到光照不足、部分遮挡、背景干扰等其他因素影响,造成多目标的检测变得极为困难,算法鲁棒性低。如何充分利用图像