论文部分内容阅读
作为计算机视觉、人工智能、数字图像处理、人机交互等多学科的交叉学科,目标识别与分类得到了广泛的关注。而随着信息技术的发展和无人机的日益普及,基于视觉的无人机在智能视频监控、三维场景重建以及军事应用等方面发挥着越来越重要的作用。本文以无人机对地面目标的识别与分类为研究重点,首先总结国内外目标识别与图像分类的研究现状,然后针对不同的地面目标以及分类任务,提出了不同的方法,论文主要分为四大部分:第一,基于多特征融合的目标识别。在该部分,首先介绍了目标检测中常用的特征表示方法,并详细阐述了HOG特征和LBP特征的提取过程。然后引入PCA算法对HOG特征进行降维,解决了HOG特征维度过高的问题,再将HOG-PCA特征与LBP特征进行融合处理,利用融合之后的特征训练SVM分类器,实现空对地场景中汽车目标的检测。第二,基于DPM模型的目标识别。在该部分,介绍了DPM模型中HOG特征的计算过程、DPM模型的相关理论知识以及使用LatentSVM训练车辆DPM模型的实现原理。在目标检测阶段,首先利用训练好的模型计算场景图像各个位置的得分,然后通过NMS消除重复的检测框以及超出图像边界的检测框,得到符合要求的检测集合,最后得到检测集合中得分最大的位置即为检测目标的位置。第三,视觉显著性和PCANet相结合的目标识别。在该部分,首先介绍了K-means算法、Mean-Shift算法、显著性区域检测模型、卷积神经网络等基础知识,然后重点论述了使用PCANet模型训练分类器的实施方法。在目标检测阶段,首先通过AC显著性检测模型确定图像中的疑似目标区域,再对检测出的疑似目标区域使用PCANet算法进行特征提取,并载入训练好的分类器过滤掉非目标区域,实现对坦克目标的检测。第四,场景图像分类与标示方法。在该部分,介绍了图像中值滤波和场景图像的分割方法。首先对中值滤波后的图像进行Mean-Shift分割,然后对分割后的图像进行轮廓提取,并创新性地提出通过设定轮廓阈值合并图像的相邻区域以解决Mean-Shift算法的过分割问题,其次提取各个区域的颜色特征和纹理特征,将融合后的特征作为SVM分类器的输入,进行类别判断,最后实现对场景图像的分类与标示。