基于深度学习的群体场景分析算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：ming5583

【摘要】

：

随着互联网以及通信技术的发展,图像以及视频数据已经成为主流,在计算机视觉任务中,群体场景分析是一个非常重要同时极具挑战性的工作,在视频异常事件检测以及视频结构化检索

【作者】

：

李鹏程

【出处】

：

上海交通大学

【发表日期】

：

2018年01期

【关键词】

：

深度学习残差神经网络场景分析群体固有特征长短时记忆模型双流模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网以及通信技术的发展,图像以及视频数据已经成为主流,在计算机视觉任务中,群体场景分析是一个非常重要同时极具挑战性的工作,在视频异常事件检测以及视频结构化检索方面有着巨大的应用前景。群体场景的类别定义取决于多层次的信息,这导致了类别之间很大的不确定性,同时,不同群体表现出的动态性质差异也很大,随着近年来深度神经网络与深度学习方法的不断成熟发展,使用深度模型来研究场景分类识别以及分析任务成为主流。由于群体场景分析任务的复杂性,建立一个强大的高准确率与高泛化能力的深度学习模型需要满足三个条件:一个用于深度模型训练的大规模群体场景数据集,提取可以有效描述跨场景的群体固有性质的量化特征,以及一个功能强大的深度神经网络。本文主要利用深度学习技术对群体场景视频数据进行识别与分析,并先后提出了基于时空域融合信息的双流残差场景分析算法以及基于卷积深度特征的长短时记忆模型算法。本文的主要创新工作如下:(1)本文提出了基于时空域融合信息的双流残差场景分析算法。通过双流网络模型算法来学习并聚合静态外观特征以及动态特征,该算法基于采用多标签属性表示方法的WWW数据集中的10000段视频,首先对数据集视频流数据进行预处理,而后利用残差神经网络提取静态图像深度特征,作为双流网络静态分支的输入。同时利用KLT算法对数据集中的每一组视频帧提取轨迹描述子,在每一帧中将所提取到的轨迹描述子生成K-NN的拓扑图,轨迹描述子符合马尔科夫时域模型,通过时域数学模型可以计算出群体的聚集性,冲突性,稳定性三个群体全局量化特征,聚集性通过附近区域行为的一致性来描述,稳定性可以基于轨迹所形成的拓扑结构图中恒定邻居节点的数量来描述,冲突性通过邻近点之间的速度相关性描述。根据对以上三个群体特征的计算得到每个视频的运动图,作为双流网络动态分支的输入,通过双流网络深度模型同时对视频中的静态特征以及动态特征进行学习。实验结果表明,该算法所训练模型在群体场景分析准确率上具有一定优势,对于现实复杂场景下的分析也有较好效果。(2)本文提出了基于残差深度特征的长短时记忆模型场景分析算法。该算法受端到端网络训练方法启发,有效利用残差深度网络提取到的图像空间域深度特征,再利用LSTM网络提取时域上的动态信息,通过Dropout层降低过拟合风险之后使用Softmax分类器进行分类,本文深入讨论了算法框架中残差神经网络深度特征的提取与优化策略,包括激活函数的选取策略与池化方式的选取策略等等,在特征提取与优化中,我们对Res Net模型、Google Net模型和VGGNet模型进行了完整试验对比与分析,本算法基于大规模群体场景WWW视频数据库,针对群体场景的试验结果表明,本算法在训练性能和运算速度上有所提升,对于场景分析任务有较好的识别准确率,并有较强的泛化能力,适用于跨场景下的群体分析任务。

其他文献

哈尔滨银行惠农信贷业务发展问题研究

三农问题长期以来一直是国家各项政策的重中之重,三农问题的核心主要是农民问题。由于农业生产的特殊性,即便中央和地方政府非常重视,认真贯彻执行相关政策、投入大量财政资金仍无法满足农民对信贷资金的强烈需求,农村地区居民融资难、融资贵问题一直无法彻底解决。哈尔滨银行作为国内首家进入农村金融领域的城市商业银行,始终把服务“三农”作为小额信贷战略的重心,致力于为惠农信贷业务注入全新活力,创新产品和服务。在三农

学位

哈尔滨银行惠农信贷信贷业务

一种红外相机NETD测试方法

本文从NETD的定义出发,详细介绍了一种红外相机NETD测试方法,并将该方法应用于某红外相机的测试。

会议

噪声等效温差红外相机

基于扩散几何的三维模型对应性分析方法研究

三维模型作为新兴的数字几何媒体越来越多的融入到人们的日常生活中,例如,在3D打印、工业产业、三维游戏动画、影视特效、生物医疗等科技领域中均得到了实际应用。同时,随着

学位

形状分析热核特征扩散几何内蕴对称检测对应性分析

基于级联网络的头部特征点自动定位系统研究

在现今的正畸医学领域,头影测量分析技术作为正畸临床诊断及治疗设计的一种重要手段,为医生对患者针对性治疗提供了极大的科学保障。而头影测量技术的关键就是在头部侧位X光片上进行头部特征点定位工作。由于头颅是一个非常复杂的三维物体,面部的不对称性、射线成像畸变等因素导致左右轮廓不能完美叠加,这与个体的解剖变异问题结合在一起,特别是在病理情况下,很难精确地定位头侧测量的特征点。手工标注特征点需要花费一个有临

学位

头部特征点定位级联神经网络交互系统

NBOS系统的异常流量行为检测

异常流量行为是指网络流量出现偏离正常范围的状况,主要是由恶意网络攻击行为以及网络配置失误、偶发性线路中断和突发的巨流等因素引起,这些事件会对网络的服务质量产生影响

学位

流记录异常流量行为时间序列分析端口流量分布

吡咯改性生物质材料的制备及其对水体中酸性品红的吸附/脱附行为研究

生物质材料是一种环境友好以及易降解的基质材料,在作为水体污染物吸附剂方面有着良好的应用。本文选用了几种来源广泛、价格低廉的生物质材料(羧甲基纤维素钠,明胶,壳聚糖,秸秆)为原料,通过添加聚吡咯(PPy)改性,制备出了生物质基PPy纳米复合材料,均表现出对酸性品红(AF)的优异吸附性能。除此之外,利用PPy优秀的导电性能及光热性能,使得制备的纳米复合材料能够借助光辅助和电辅助进行脱附,降低了吸附剂对

学位

生物质材料聚吡咯酸性品红光辅助电辅助

中空和核壳结构纳米催化剂的制备及应用

众所周知,具有特定形状和大小的负载型纳米催化剂具有优异的催化性能,良好的选择性和可重复利用性。但是纳米催化剂的应用也存在一些挑战,例如在纳米催化剂的合成和应用过程

学位

纳米催化剂Baeyer-Villiger氧化反应β-酰胺酮

新疆冰雪运动特色小镇的品牌建设研究

特色小镇是积极响应国家新型城镇化建设的号召,为促进经济的转型升级、实现国家供给侧的改革,而探索培育的一种区别于行政建制镇的新型发展创业平台;体育特色小镇作为特色小镇的下位概念,是在遵循特色小镇建设的基础之上,将体育元素加入其中,以促进全民健身战略的实施和体育产业的蓬勃发展的空间区域和发展平台。体育特色小镇的建设发展,也将极大地提高了人们参与群众体育、休闲娱乐的积极性。新疆水西沟冰雪运动特色小镇是全

学位

基于移动位置的信息分享服务系统研究与实现

目前移动互联网技术、移动通信技术正在飞速发展,智能终端不断得到普及,人们随时随地享受着与位置相结合的移动应用给我们生活带来的便利。随着用户需求的不断深入,现有的地

学位

位置服务百度地图API信息分享室内分布展示

基于云的低成本RFID公钥认证协议的设计与分析

射频识别技术(Radio Frequency Identification,RFID)是无线通信中的一种非接触方式的自动识别技术,可以同时多目标一起识别或者对高速移动目标进行识别,被广泛应用于制造业

学位

RFID云计算认证协议NTRUBAN逻辑

基于深度学习的群体场景分析算法研究

其他学术论文