论文部分内容阅读
目标检测作为图像处理和计算机视觉的重要分支,已广泛应用于民用和军事领域,包括:自动驾驶、智能监控、肿瘤筛查、武器的精确制导。目标检测的核心任务是对给定任意尺寸的图像,使用视觉感知模型和搜索策略对图像中的目标进行精确的识别与定位。随着人工神经网络的发展,使用深度学习方法解决目标检测问题仍是当今世界的研究热点。特别是,基于卷积神经网络的目标检测框架在速度和精度上的优势,促使越来越多的科研工作者致力于运用深度卷积神经网络来解决目标检测问题。尽管基于卷积神经网络的目标检测算法的性能有了较大提高,然而由于目标表示模型与人类视觉感知系统存在的偏差,目标检测器的精度还不能满足实际场景的需求,特别是多尺度目标的检测精度。论文主要从提高目标候选区域质量和改善目标检测框架性能的路线出发,对多尺度目标检测展开研究,实现快速准确地检测视觉场景中的多尺度目标。本文的主要工作及创新点如下:1.针对大、中尺寸目标,提出了一种基于卷积边缘特征网络与目标显著性的候选区域算法,提高了大、中尺寸目标候选区域的召回率。首先,运用卷积边缘特征网络提取更丰富的目标边界信息;然后,利用目标区域与背景区域间颜色对比度特性描述目标显著性特征;第三,为场景中的目标建立空间位置模型;最后,使用丰富的目标边界信息、目标显著性特征、目标空间位置模型生成目标候选区域。在PASCAL VOC 2007测试集上的实验结果显示,给定500个目标候选框,固定交并比0.5,对于大、中尺寸目标,所提算法的召回率较选择性搜索算法Selective Search分别提高1.74%、2.59%。同时,在[email protected]上,处理一张同时含有不同尺度目标的图像,所提算法所需时间为0.76秒,与Selective Search算法相比,提高了算法的运算效率。2.针对小尺寸目标,提出了一种基于边缘特征网络与超像素显著性的候选区域算法,可提高小尺寸目标候选区域的召回率。首先,对图像进行超像素分割,获取超像素;然后,根据超像素与相邻超像素间的颜色差异值、超像素的空间位置、超像素的完整性方面定义超像素的显著性;最后,融合卷积边缘特征网络生成的目标边缘信息及超像素显著性信息生成目标候选区域。在PASCAL VOC2007上的实验结果显示:针对小尺寸目标,所提算法可提高小尺寸目标候选区域的质量。同时,选取2000个目标候选区域,送入到Fast RCNN网络中,与对比算法相比,所提算法能够获得最高的mAP,这表明所提算法性能较好。3.针对当前主流目标检测框架难于处理大场景中的小尺寸目标,提出了改进的Faster RCNN和改进的SSD算法,显著提高了小尺寸目标的检测精度。其中,针对Faster RCNN,使用RPN网络的浅层特征、小尺度瞄点的方式改善Faster RCNN检测小尺寸目标的性能;针对SSD,引入上下文信息提高SSD检测小尺寸目标的准确性。特别地,为了验证所提算法在小尺寸目标上的检测性能,制作了VOC_MRA_0.58数据集,实验结果表明:改进后的Faster RCNN算法在小尺寸目标上的检测精度较Faster RCNN提高约6%;改进后SSD算法的检测精度较SSD算法提升7%。