基于卷积神经网络的目标检测若干问题研究

来源 :电子科技大学 | 被引量 : 27次 | 上传用户:xiaoguang0623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉、机器学习、人工智能等领域的研究热点,在诸如智能视频监控、机器人环境感知、大规模图像检索等方面都有广泛的应用。当前,基于卷积神经网络的目标检测方法是一种主要的目标检测方法,使用学习的特征替代手工制作的特征,从而提高目标检测的准确度。虽然基于卷积神经网络的目标检测方法已经取得了丰硕的研究成果,但是仍然存在一些关键问题没有解决。一方面,由于现有目标检测器缺乏场景自适应性,导致检测器不适应监控场景的视角变化,目标检测的准确度急剧下降。另一方面,由于现有目标检测器缺乏记忆与预测机制,导致检测器不具有记忆能力和预测能力,目标检测的准确度难以提升。为了解决上述两个问题,本文开展了两个方面的研究——面向监控场景的目标检测方法研究和基于记忆预测的目标检测方法研究,针对每个研究方面进行了两项研究工作。本文主要的工作以及贡献如下:(1)针对现有车辆检测器缺乏场景自适应性的问题,提出了一种基于网络调整和结构优化的车辆检测器迁移方法,采用特征层次的迁移、网络结构的优化以及样本层次的迁移,使基于卷积神经网络的车辆检测器逐渐适应监控场景。首先,根据不同视角下车辆特征的差异,调整不可跨视角使用的网络参数。然后,根据同一层中特征图的相似度,逐层地合并相似的特征图。最后,从通用场景的车辆样本集中发掘与监控场景具有相似视角的车辆样本,共同调整网络的参数。实验结果表明,该方法通过网络调整和结构优化分别提高了车辆检测器在监控场景中的检测率和检测速度,成功地迁移了基于卷积神经网络的车辆检测器,获得较好的检测效果。(2)为了构建具有场景自适应性的目标检测器,提出了一种基于网络迁移和上下文学习的目标检测器构建方法,通过迁移卷积神经网络和学习上下文信息两个步骤,构建针对监控场景的自适应回归模型,预测目标在监控场景中的位置。第一步,根据监控场景中样本在卷积神经网络中的激活值,从每个卷积层中挑选可用卷积核,使无用卷积核不再参与特征提取的过程。第二步,根据监控场景的上下文信息,将局部上下文信息和全局上下文信息分别融入到上下文卷积神经网络的卷积层和池化层。实验结果表明,该方法通过迁移卷积神经网络和学习上下文信息分别提高了特征提取的场景自适应性和目标位置预测的准确度,成功地构建了针对监控场景的自适应回归模型,无论是行人检测还是车辆检测,都获得较好的检测效果。(3)针对现有目标检测器缺乏记忆和预测机制的问题,提出了一种基于人类记忆和预测机制的目标检测器设计方法,将卷积神经网络和回复式神经网络整合到同一框架中,使模型具备记忆序列模式的能力和预测目标位置的能力。第一,为了模拟人类记忆单个目标的过程,将单张图像转换为图像序列,利用卷积神经网络和长短时记忆模型记忆和识别单个图像序列的模式。第二,为了模拟人类预测多个目标的过程,将长短时记忆模型转换为回复式卷积神经网络,同时识别多个位置的序列模式以预测检测图像中目标的位置。实验结果表明,在引入记忆和预测机制后,该方法设计的目标检测器成功地记忆了图像的序列模式并且准确地预测了目标在监控场景中的位置,无论是行人检测还是车辆检测,都取得最好的检测效果。(4)为了使行人检测器进一步模拟人类的记忆过程,提出了一种基于序列次序交换和序列模式记忆的行人检测器设计方法,在记忆行人序列模式的同时学习合适的行人序列次序,使行人检测器可以更快速且更准确地记忆和识别行人的序列模式。首先,为了实现序列次序交换的过程,在卷积神经网络和长短时记忆模型之间添加次序交换的步骤,利用交换矩阵将特征序列按照重要程度重新排序。然后,为了同时学习行人序列的次序以及记忆行人序列的模式,分别采用反向传播算法和通过时间的反向传播算法训练交换矩阵和长短时记忆模型。最后,为了提高行人检测的速度,采用基于候选区的目标检测框架,识别每个候选区中图像序列的模式。实验表明,在加入次序交换后,该方法设计的行人检测器成功地学习了行人序列次序并且准确地记忆了行人的序列模式,在检测率和检测速度上都与当前最好的行人检测器不相上下。
其他文献
影响学校教育实践活动的形式以及开展目标方向的决定性元素就是教师。在笔者看来,学校教育之所以无法被其他教育元素所期待,就因为我们是有个性的教师,在进行着教学活动的个
在新课程改革的大背景下,教师物理教学的目标不应只局限于分数,应将更多的目光放在培养学生的核心素养和综合素养上, 教师在物理教学中,应转变自己的教学思路,开拓创新更适合
目的探讨原发性气胸的诊疗方法及疗效。方法对笔者所在科自2001年1月至2007年5月收治的17例原发性气胸患者的临床特点、治疗方法、治疗结果及相关因素进行了观察分析。结果本