论文部分内容阅读
随着智能交通系统的逐步建立,交通监控视频中车辆检测技术的需求不断扩大。本文对视频中车辆检测面对的难题和现有的方法进行了研究,然后结合Faster R-CNN和ViBe算法提出了本文的视频中车辆检测方法。本文的主要工作如下:1.针对视频中的车辆检测,本文提出了一个融合运动目标检测技术(ViBe)和基于深度学习的静态图片目标检测算法(Faster R-CNN)的新框架。该框架的设计和实现是为了解决两个问题:1)为了解决传统的运动目标检测算法在复杂情况(光照突变,画面抖动,车辆遮挡等)下检测正确率较低的问题,本文利用Faster R-CNN,通过对大量复杂情况下的车辆训练数据进行学习,能够更加准确、稳定地在复杂的情况下检测出车辆。2)为了进一步减少Faster R-CNN的计算时间和避免误判的发生,本文利用ViBe算法快速地提取运动目标区域,能够极大地减少Faster R-CNN需要处理的数据量,并且降低Faster R-CNN的误判率,从而提升了检测的速度和准确率。2.为了实现ViBe算法和Faster R-CNN融合的高效性和统一性,本文在以下的几个方面对算法做了改进:1)本文提出利用Faster R-CNN对第一帧图像的检测结果来指导ViBe算法模型初始化的改进,使其能够避免“鬼影”的产生。2)本文利用上一帧Faster R-CNN提供的检测结果来指导当前帧中ViBe算法的模型更新和前景判断策略,从而提升算法对各种复杂情况的鲁棒性。3)本文将Faster R-CNN中不同的卷积层的特征组合起来,使分类器能够获取到更多层次的信息,从而能够更好地检测出视频中小的车辆。4)本文结合了时域上的信息对Faster R-CNN中RPN提取的候选区域进行筛选,能够在保持准确率的情况下减少大约50%的候选区域的数量。5)本文提出了一种权值时域非极大值抑制算法,对视频中时域上的结果进行建模,用来给当前帧分类结果重新打分并筛选,能够在一些Faster R-CNN检测失败的困难场景得到更准确的检测结果。3.本文基于广东省交通集团提供的广东省高速公路监控视频数据,制作了一个有超过10000个正样本的高速公路监控视频中的车辆数据集,用于进行算法的实验和验证。在这个数据集中,本文提出的算法和现有方法相比,同时具有较高的准确率和较快的速度,能取得较好的效果。