基于语义主题模型的人体异常行为识别研究

被引量 : 0次 | 上传用户:shrimpdragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能视频监控系统在特定场景中对停留或经过的目标进行实时监视,其主要目标是自动提供场景描述,并根据观察到的信息对目标行为和目标间的交互进行理解和预测。作为对传统视频监控系统的革新,智能视频监控系统正越来越受到人们的重视。对于视频序列中人体异常行为的分析识别是智能视频监控领域中日益受到重视的一个研究方向。基于人体异常行为分析的智能视频监控系统不仅能忽略大量监控系统中对安防无用的信息,能够高效地完成保障安全的任务,还能节省大量的人力物力,给社会带来很大的经济效益,并且能够实现即时报警,解决了传统监控系统的事后性问题。本文从认知心理学角度出发,针对现有人体异常行为分析识别技术存在的人体运动难以精确检测和跟踪、人体异常行为模型难以精确定义、人体异常行为判决难以解释和缺乏实时性等问题,提出了基于语义主题模型的人体异常行为识别方法,以“低层运动词包建模—中层人体行为语义建模—高层异常行为语义识别”为路线展开研究,以下所提出的算法均在实践中进行了应用。本课题研究的难点在于如何使计算机能够从人的认知角度理解监控场景中人体行为的语义信息,有效辨别各种人体行为类型之间的相似性。本文的主要贡献如下:1)针对基于传统语义主题模型的人体行为建模方法中,传统语义主题模型(例如:LDA和PLSA模型)仅仅关注运动词汇的语义而忽略运动词汇间的时序关系问题,提出了隐马尔科夫主题模型(Hidden Markov Topic Model, HMTM)。HMTM模型是关注运动词汇时序关系的隐马尔科夫模型(Hidden Markov Topic Model,HMM)和关注运动词汇语义的主题模型(Topic Model,TM)的组合模型,其不仅能捕捉运动词汇间的时序关系,而且能建模运动词汇间的共现关系。HMTM模型克服了语义主题模型在检测精度和鲁棒性上的不足,能比较好地实现监控场景中人体行为聚类的任务。2)针对具有较长时间跨度的人体复杂行为建模问题,提出了协同聚类主题模型(Co-Clustering Topic Model, CCTM)。CCTM模型是基于已有的协同聚类算法(Co-Clustering Algorithm)和主题模型构造,能同时地聚类视频序列和运动词汇。CCTM模型是一个四层主题模型,该模型将视频序列(video)建模为行为的随机组合,同时行为是视频序列中某些视频剪辑(clip)的概率分布;而视频剪辑建模为动作的随机组合,同时动作是视频剪辑中视觉词汇的概率分布。CCTM模型不仅能捕捉运动词汇之间相关性,而且能建模动作(主题)间的相关性;同时改进了传统协同聚类算法的可解释性。CCTM模型克服了传统协同聚类算法和主题模型在人体复杂行为建模过程中测量精度、鲁棒性和计算效率上的不足,能比较好地实现监控场景中行为聚类的任务。3)针对CCTM模型仅仅关注行为间的语义而忽略行为间的时序关系问题,提出了主题隐马尔科夫层次模型(Topic Hidden Markov Model,THMM)。THMM模型是基于已有的马尔科夫模型和主题模型构造,不但聚类运动词汇成简单动作,而且聚类简单动作成全局行为,同时建模了行为时间上的相关性。THMM是一个四层贝叶斯主题模型,该模型将视频序列建模为行为的马尔科夫链,同时行为是视频序列中某些视频剪辑的概率分布;而视频剪辑建模为动作的随机组合,同时动作是视频剪辑中视觉词汇的概率分布。THMM模型克服了传统隐马尔科夫模型和主题模型在在人体复杂行为建模过程中精度、鲁棒性和计算效率上的不足,能比较好地实现监控场景中行为聚类的任务。4)针对语义主题模型只能进行离线和批量推理(即:分类判别)的问题,提出运行时累积的异常性测度及其在线异常行为检测方法和基于在线似然比检验(Likelihood Ratio Test,LRT)的实时正常行为分类方法,克服了实时行为识别过程中由于缺乏充分视觉证据而引发的行为类型歧义,能比较好地实现监控场景中实时异常行为检测和在线正常行为识别的任务。该方法首先引入一种运行时累积的测度在线判定新出现的人体行为是否异常,然后进一步采用在线LRT方法实时判断正常行为属于哪一种人体行为类型。在线LRT方法是基于获得充足视觉证据做出的识别决策,并且是在尽可能短的时间内确保鲁棒性的异常检测和行为识别。5)针对语义主题模型只能进行离线和批量推理(即:分类判别)的问题,提出了一种Fisher核函数(Fisher Kernel)和基于在线单类Fisher核支持向量机(Fisher Kernel Online One-class Support Vector Machine, FK-OOCSVM)的在线异常行为检测方法,克服了语义主题模型难以适应小样本空间和实时检测的不足,能比较好地实现监控场景中实时异常行为检测的任务。Fisher核函数是一种“语义核”,其基于语义主题模型的概率分布测量两个视频序列内容上的相似度。FK-OOCSVM方法将异常行为检测归结为孤立点检测问题,首先通过语义主题模型将行为实例映射到固定维度的线性空间,再通过单类支持向量机(One-class SVM)检测孤立点,从而实现异常行为检测。
其他文献
近些年来,房地产企业受国家宏观调控政策、外部监管力度的不断加大、市场竞争的日益加剧等多方面因素的影响,房地产企业的经济效益受到前所未有的挑战。笔者认为,无论是企业
目的:通过亚甲蓝肛周封闭与苦参汤熏洗两种方法对湿热下注型肛周湿疹的治疗,对其疗效及治愈后复发情况进行对比观察。方法:共纳入符合标准的湿热下注型肛周湿疹病例55例,随机分
信息技术在现代教育中的重要作用日益凸现,依托现有教育网的通信网络平台,构建集数字化传递、可视化终端、栅格化网络于一体的网络可视教学系统已成为教学手段信息化的重要内
传信语是传信范畴的具体表征。本文以现代汉语“X说”类传信语为研究对象,包括转述型传信语、归纳型传信语和信念型传信语,从共时与历时的双重视角出发,对三者在语义、句法和语用等方面的特征进行分析阐述,并在传信范畴下分别对每一类型传信语内部成员展开对比研究。第一章为绪论,主要说明本文的选题意义和国内外相关内容的研究概况,关于现代汉语“X说”类传信语研究有可能突破的方面,以及本文的研究方法和语料来源等情况。
多电平逆变器具有功率开关管上的电压应力低、输出电压中含有的谐波含量少和电压变化率低等优点,在大功率场合得到了广泛的应用。其中,NPC三电平逆变器是应用最广泛的结构之一,
当今国内加工制造业面临巨大的冲击和挑战,需要采用先进的生产理念和管理模式来提升企业的竞争力。高级计划于排程APS (Advanced Planning and Scheduling)技术是一种新型的
战争系统是一个典型的复杂巨系统,信息化条件下的作战体系与以往的战争系统相比,规模更加巨大,关系更加复杂。如何对信息化条件下的作战体系网络内部的复杂关系进行描述是当今战
从复杂网络研究的角度研究互联网的拓扑特征,已经成为当今互联网研究的一个重要分支,受到学术界广泛关注,近年来在此领域也取得了丰硕的成果。互联网复杂性研究主要是通过对
党的十六大以来,以胡锦涛为总书记的新一届中央领导集体在世情、国情、党情、民情发生深刻变化、全面建设小康社会、党自身建设和执政为民促进社会和谐发展的历史条件下,继承
目的探讨41例急性心肌梗死室性心律失常患者应用胺碘酮进行治疗的临床效果。方法选取2015年10月至2018年10月就诊于本院并接受相应治疗的众多急性心肌梗死室性心律失常患者中