基于视频深度学习的人物行为分析与社交关系识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ysksy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别视频中人物行为与社交关系是理解视频语义的重要任务,其主要难点在于如何通过运用深度学习等算法来分析和整合与人物行为相关的视频语义线索。近年来传统的深度学习算法在简单静态图片识别方面取得了突出成就,但是仍不能满足视频中复杂的人物行为与社交关系识别要求。本学位论文以识别视频中的人物行为语义与社交关系为研究目标,首先提出一种基于长短期记忆(LSTM)模型的语义识别算法来识别视频中人物行为,再通过一种基于无向有权图的节点聚类算法来完成视频中人物社交分组,最后通过部分标记因子图模型(SPLP-FGM)来推断视频中人物的社交关系。此外,本文在微软视频描述语料、电影描述的语料库两个数据集上进行人物行为语义识别实验,在电视剧Friends数据集上进行人物社交关系识别实验。实验结果表明,本文提出的基于LSTM模型的语义识别算法能够高效和全面地识别视频中人物的行为语义,部分标记因子图模型能够有效地识别视频中人物之间的社交关系。本文的工作创新主要体现在以下三个方面:(1)利用卷积神经网络并行地抽取每个视频场景中的人物身份、人物动作和上下文等三个方面的中层语义特征,通过两层循环神经网络来融合这三个方面的语义信息来完成视频中人物行为语义的识别;(2)将视频中的人物社交映射成无向有权图,通过一种基于无向有权图的节点聚类算法来完成视频中人物的社交分组;(3)在完成视频中人物的社交分组和行为语义识别的基础上,通过构建和学习部分标记因子图模型来推断视频中所有的未知人物社交关系。
其他文献
目的:高级别宫颈鳞状上皮内瘤变(high-grade squamous intraepithelial lesion,HSIL)是指若不治疗,有明显的进展为浸润癌风险的宫颈鳞状上皮内病变,包括p16染色阳性的CINII、CINIII级病变以及以前被命名的重度非典型增生和原位癌,是与子宫颈浸润癌密切相关的一组子宫颈病变。子宫颈癌是目前能够早期预防、早期治疗的妇科恶性肿瘤,由宫颈上皮内瘤变发展成宫颈癌
目的 观察基因重组人生长激素(rhGH)对生长激素缺乏症(GHD)患儿的疗效。方法 对15例GHD患儿应用rhGH治疗,每晚睡前皮下注射0.1 IU/kg,疗程6个月。结果 患儿身高由治疗前109.3
目的 对我院2013年至2015年20例ABO血型正反定型不一致病例进行血型血清学分析,以正确鉴定ABO血型,为临床输血治疗提供安全保障。方法 采用全自动血型及交叉配血分析仪及试管
现代学徒制人才培养模式是职业教育的有力抓手。基于知识生产模式3的规律,分析了现代学徒制人才培养过程的多主体参与、多层次传递、多知识集群及网络化运用等特征,提出了现
当今社会,文化产业作为一门新兴产业,正在被迅速的推动与发展中。而淮南作为豆腐这一食物诞生的故乡,利用豆腐进行文化营销,是促进淮南经济发展与豆腐文化繁荣的不二选择。本
今年,金川矿业公司加强班组建设,夯实基层基础管理,提高班组管理水平,收到了明显成效。班组是煤矿最基层的组织,是杜绝违章操作和人身伤亡事故的主体,是实现企业安全的第一道
目的探讨胃癌组织VEGF-C启动子序列的甲基化状态及其在胃癌发生发展过程中VEGF-C甲基化状态的改变。方法通过RT-PCR、 Western blot检测胃癌细胞株中VEGF-C mRNA与蛋白表达;采
生涯学园是一种设立在美国高中的小规模校中校,该校中校同时为学生高校入学和未来职业生涯提供服务。已有40多年发展历程的生涯学园是美国高中教育改革的一种较为成功的尝试
介绍了用显示求解方法进行准静态压溃加速模拟的理论基础。应用LS-DYNA软件对铝合金保险杠进行准静态压溃仿真分析,试验结果与仿真结果吻合较好,验证了铝合金保险杠有限元模
研究了从陈化黄酒中筛选出的3株产酸菌(2株乳酸菌、1株酵母菌)的耐温性、耐酒精性和耐酸性等生理特性,结果表明,高酒精度(>14%vol)、低温(<15℃)能较有效地抑制3株菌的生长,