基于深度学习的洗车工行为识别方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:laire723
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉与智能监控领域的研究重点。目前简单背景下的人体行为识别已经取得了较高的识别率,但是对复杂场景下的人体行为识别的研究仍存在不足,本文以洗车行这种复杂环境为背景对人体行为识别进行研究。传统的行为识别算法是采用人工设计的特征,这种方式不仅费时而且很多时候能否选取到好的特征依靠的是经验,同时调节起来也需要很多时间。而深度学习舍弃了传统的依靠人工设计特征的方法,通过构建一个多层的神经网络让机器自动学习隐藏在数据内部的关系,得到数据的特征,这种方式使得学习到的行为特征更加准确,更有利于对行为进行正确的识别。卷积神经网络作为深度学习算法体系下的典型网络,在图像领域取得了已经取得了不错的研究成果,但是在对以视频为输入的行为识别方面的算法依然存在不足,有待改进。本文介绍了可接受以视频作为网络输入的应用于行为识别的3D CNN,该算法是将应用于图像的二维卷积操作扩展成三维,加入时间域,使得网络不仅可以学习到静态图像上的内容还可以学习到视频连续帧中人体的运动信息。但是该网络的下采样层依然是二维下采样,而且无法接受帧数不同分辨率不同的视频输入,适用性小。基于3D CNN网络的不足,本文对其网络结构进行了四点改进,卷积层加入了非线性的MLP卷积操作,使得网络的抽象能力更强。因为时间域与空间域一样也具有一定的不变性,所以下采样层将扩展到三维,加入了时间域的下采样,在保留有用信息的同时减少网络需要学习的参数,提高网络性能。然后加入了时空金字塔下采样技术,既避免了输入信息的损失,又使得网络可以接受不同帧长和分辨率的视频输入。采用ReLU非线性函数来代替原网络的tanh函数作为激活函数,ReLU函数属于不饱和函数,不会像tanh正切函数一样在训练时减小反向传播的误差,而且还可以加速网络训练的收敛,最后采用softmax分类器。改进后网络的输入将舍弃原来网络的梯度通道,让网络自动从数据样本中学习到的梯度信息。最后在背景简单的KTH数据集和背景复杂的洗车行数据集上分别进行实验并给出实验结果,对改进后算法的优点、数据集对于实验结果的影响进行了分析。网络的时空复杂度是评价网络性能的重要指标,本文最后对改进后网络的时空复杂度进行了详细分析。
其他文献
2006年4月6日,中国石油吉林石化公司700kt/a乙烯改扩建工程乙烯装置新区生产的乙烯产品全部达到设计指标,这标志着吉林石化成为中国石油目前最大的乙烯生产基地。
目的观察小剂量吗啡复合地塞米松在经尿道前列腺电切术后的镇痛中的应用。方法收集经尿道前列腺电切术患者40例,术后随机分为两组,给予不同镇痛方法,术后随访、评分并进行比较。
从2000年之后,一种新型高介电的钛酸铜钙(CaCu3Ti4O12,CCTO)材料受到了国内外学者的广泛关注。这种材料的介电常数不仅高达104,而且能在较宽的频率(20-105 Hz)和温度(30-180℃)范
木薯(Manihot esculenta Crantz)是热带亚热带重要的粮食作物和能源作物,具有广泛的应用价值。本试验选用华南205、华南5号和华南8号为材料,在本实验室已建立的木薯组培快繁
主要论述京津城际运行的CRH3C型动车组在运行中监控装置报68C9故障的统计分析,同时对造成故障的原因进行研究,制定了部分措施,并对后期预防68C9故障措施提出建议。
国网浙江省电力公司建立了与专业岗位任职资格相结合的员工安全技术等级认证体系,通过全面推行员工安全技术等级认证、复证,并将员工安全等级与安全生产绩效评价相结合,既满
海岛的电磁散射特性研究在环境电磁散射领域具有重要研究意义,由于真实场景往往具有十分复杂的几何模型和散射特性,加上多种环境交错分布,使得建模和散射分析尤为困难。如今
针对某石化新材料公司非光气法聚碳酸酯项目研发设计的重力除灰式废气废液焚烧装置,有害物质去除率≥99.99%,且排放尾气粉尘≤20mg/m^3,SO2≤50mg/m^3,NOx≤180mg/m^3。该装
受电弓是利用车顶接触网获取和传递电流的机械组成,是动车组重要组成部件,其状态直接影响动车组的运行安全。文章简要介绍了CRH3C型动车组法维莱受电弓设计特点,并对CRH3C型