论文部分内容阅读
目标检测是计算机视觉领域中的一个重要课题,其主要任务就是从视频或者图像中检测出特定目标。目标检测综合应用了图像处理、模式识别、人工智能等技术,在军事、视频监控、人机交互等方面有着广泛的应用前景。传统的目标检测算法在一些简单的场景中取得了良好的成绩,然而在复杂的场景中却难以满足需求。深度学习的兴起为复杂场景下的目标检测带来了新思路,深度神经网络依靠其深层次网络带来的强大特征提取能力,将原始输入数据的低层次特征抽象为高层次特征,从而更有利于目标检测。本文首先分析了国内外目标检测算法的研究现状,然后对Faster R-CNN(Faster Region-Based Convolutional Neural Networks)算法进行了深入的研究,最后在Faster RCNN算法的基础上实现了两种改进算法,并在PASCAL VOC 2007数据集上对改进算法进行了验证。本文的主要研究工作如下:(1)针对Faster R-CNN算法中候选区域生成网络和分类回归网络采用单独特征提取网络的网络结构进行了研究。实验结果表明改进网络结构的准确率比Faster R-CNN原始算法提高了2%。(2)针对Faster R-CNN算法中候选区域生成网络所输出的候选区域质量较低、存在大量无效区域的问题,本文对候选区域生成网络输出的候选区域进行优化,通过一个候选区域优化网络过滤大量的无效区域。实验结果表明改进算法与Faster R-CNN算法的准确率基本接近,但是改进算法平均每张图像的检测时间比Faster R-CNN算法少了7ms,从而证明该改进措施是有效的。