论文部分内容阅读
随着图像与视频大数据的出现和GPU类部件运算能力的提高,促进了深度学习的理论与技术的发展,计算机视觉的发展随之达到了新的高度。图像目标检测技术在人工智能多个领域的应用也越来越广泛。其中图像目标检测方法和技术的研究己经取得了显著的成果,成为计算机视觉的一个研究热点,并在性能上获得了较大的提升。对海量图像数据进行识别理解可以应用在安防、医疗与交通等多个方面,具有广泛的应用价值。野外巡线系统图像目标检测具有一系列特点,比如目标角度变化范围大、图像分辨率较高、检测目标尺度大小不同、天气影响图像质量、图像目标模糊、目标形态和图像背景多变等问题。论文基于深度学习的卷积神经网络框架,改进了图像目标检测算法,并对其进行优化,以解决巡线图像目标检测中存在的难点。主要工作与成果如下:(1)几种主要深度学习算法在巡线图像检测中的应用比较研究。结合野外巡线系统拍照图像的特点,对RCNN、Faster R CNN、YOLO及SSD模型算法进行对比实验。实验过程与结果表明,在野外巡线图像目标检测方面,这几种算法优于传统图像检测方法。其中Faster R CNN和YOLO的性能更为突出。(2)针对Faster R CNN算法中候选框特点不突出,提出了基于Faster R CNN的多特征、多目标改进的目标检测模型(MMF R CNN)算法。对模型算法进行改进,综合特征和专注RPN,加大目标特征权值,减少巡线图像中的背景干扰。把IRPN和巡线图像目标检测网络同时训练,获得了MMF R CNN的目标检测模型。实验表明,MMF R CNN模型在改进的数据集KITTI上的检测精度mAP有了较大的提高,但检测时间并没有增加。(3)在巡线图像中,由于摄像设备距离目标距离长,出现小目标检测问题。基于回归的YOLO目标检测算法改进的E-YOLO算法,是一种基于全卷积网络的目标检测算法。该算法针对YOLO算法中小目标检测不准以及定位效果不好问题进行改进,由于不受输入尺度的影响,增加了YOLO算法的检测灵活性。同时改进了一种多边框预测方法,以提高小目标的检测速度FPS。(4)基于GAN的数据集扩展,解决了小样本数据集问题。深度学习通常需要大量的数据作为支撑,数据量少,往往会造成过拟合等问题。公开的数据集大,但是没有完全适合本课题的数据集。在本研究实验中,基于公开的KITTI数据集,结合1000多张实拍的巡线图像,利用数据集扩展技术,解决小数据集问题。为了进一步验证所设计的检测算法是否具备良好的泛化能力,在改进的KITTI数据集进行一系列的相关实验。通过实验结果对比分析,所设计和改进的基于卷积神经网络的巡线图像目标检测方法,能够在准确率和速度上都取得了良好的效果。