基于多层级LSTM的群组行为识别研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:propelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度神经网络的发展以及实际应用的迫切需求,行为识别技术处于计算机视觉领域的核心地位。神经网络的进步推动了行为识别的不断进步,在很多领域具有很高的经济价值以及学术研究价值,例如智能监控、智能交通和虚拟现实等领域。行为识别大多是指对单人的行为动作进行分类,但是在实际应用当中,大多数场景都是由多人完成的,如篮球运动,商场视频监控等场景,因此,研究多人共同完成的“群组行为”有着重要的意义。本文以长短时记忆网络(LSTM,Long Short Term Memory)为网络结构的基础,构建深度网络模型,分析排球比赛中每个个体的行为和多个个体之间的交互关系,以此完成对排球比赛中群组行为的推断,以达到群组行为识别的目的。群组行为虽是由多人协同完成,但群组行为的完成往往是由起主导作用的几个核心成员所决定,其他成员对群组行为识别贡献很小甚至无关。本文将对群组行为贡献大的成员称为“关键人物”,以关键人物为核心建立模型,对其个体特征、交互特征分析推断来完成群组行为识别。基于上述思想,本文提出了基于多层级LSTM(个人级、场景级、群组级)的群组行为识别方法:首先,将跟踪到的每个成员的边界框图像和场景图像分别输入到CNN进行静态特征提取;然后,将CNN的输出作为单人LSTM网络和场景LSTM网络的输入,进行动态特征提取。其中,堆叠连续两帧之间的光流信息,计算出每个成员的平均运动强度,按照运动强度大小将其进行降序排列,平均运动强度大的个体则为长时间具有较强稳定运动的个体,即“关键人物”;再则,按照关键人物重要性顺序输入到门控融合单元GFU,GFU利用场景特征对成员进行定位,以关键人物为核心,融合成员之间以及成员和场景之间的位置关系作为群组交互信息;最后,将融合得到的群组信息输入到群组LSTM生成群组时空特征,并利用softmax分类器进行群组行为识别。实验选用公开的排球数据集进行测试,达到了86.7%的识别精度。
其他文献
工程建设向来是一个高风险的行业,在整个项目的生命周期中都会面临风险的巨大挑战。对于投入高、周期长的高速路项目来说,在工程的具体实施过程中,需要综合考虑人员、设备等
随着中国制造2025战略的提出,我国制造业各领域都向着自动化与智能化的方向发展。焊接技术作为工业重要的组成部分之一,智能化焊接对于工业发展有着重要意义。焊缝识别技术作
随着传统能源的枯竭和环境问题的日益严重,人们的注意力更多地集中在新能源的开发和利用上。太阳能与其它可再生能源相比,具有能源储量大、环境效益好、经济性强的优点,因此
本文对上海烟草(集团)公司“八·五”初期开始引进的中速卷包机组和“十·五”初期开始引进的高速卷包机组的代表性机型,从年生产能力、主要原辅料消耗、固定资产折旧、设备
随着民航业快速发展,航班起降架次逐年增加,航班延误对机场运行的扰动日益严重。停机位分配是机场运行的关键环节之一,合理的停机位分配方案可以减少航班延误对机位预分配方
随着社会不断进步以及经济快速发展,城市化进程也在逐渐地加快。城市化是能有效推动城市的社会经济进步和国民经济发展的一个重要因素,是评价一个城市综合竞争力的一个重要指
在物流领域的信息技术不断发展的今天,物流需求不断向多样化、动态化和复杂化的特征变化,与此同时,随着物流资源整合与配置平台的发展,面对海量、多粒度的物流资源表征信息、
随着互联网的高速发展,人与人之间的跨语言交流也日益频繁,完全依靠人去处理互联网上日益增长的翻译需求显然是不可能的。机器翻译便是解决这一问题的有力手段之一。机器翻译
随着新时代电子商务的迅猛发展,物流配送的地位也随之越来越高,成为了电子商务向前发展的重要基石,同时其与电子商务发展的不对称性也将对电子商务产生反向制约。现代物流的
随着现代人工智能信息技术的不断飞速发展,人脸识别等新技术技术逐渐得到兴起,人脸检测技术也变得愈发重要。早期的各种人脸图像检测技术主要用于研究的对象是具有很强约束力