论文部分内容阅读
近年来,随着计算机技术及网络的发展,图像数据库的日益增多,如何从大量图像数据中快速提取视觉信息已成为智能视觉感知领域的研究热点,而对图像数据进行分类成为获取图像信息的重要研究问题之一。图像分类在图像检索、人机交互、智能安防、无人机平台等方面都有着广阔的应用前景。本文对自然图像分类中的关键技术展开研究,主要工作及创新点如下:1)对自然环境的图像分类问题进行了较为全面的分析和研究,目前传统的图像分类技术存在图像特征未包含全局结构信息、图像特征在表征图像信息时不够完整、分类器的选择与设计等问题,而针对这些问题进行的研究为今后的研究工作提供了有价值的参考。2)针对当前提取图像局部信息无法表示图像全局结构特征的缺陷,提出了一种基于全局非线性编码和空间金字塔匹配的图像分类方法,在空间金字塔匹配中引入了全局结构信息,避免了因缺少全局结构信息造成的分类正确率低,使用STL等公开数据库的测试结果表明该方法的有效性。3)针对全局非线性编码等传统的图像分类算法中是由人工提取指定的局部特征,存在其往往不能较为全面地表示图像信息,进而影响分类效果的问题,利用稀疏自编码器算法进行图像特征的自学习,用深度学习中的卷积神经网络对图像进行分类,并讨论分析了参数的选择过程。该方法中的特征自学习部分能更为完整地表征图像信息,而其网络结构也可表达图像的低级和高级抽象特征,实验结果也验证了与全局非线性编码等图像分类算法比较该方法有更高的分类正确率。4)针对传统的卷积神经网络是直接输入原始图像而没有考虑到图像多尺度因素影响的问题,提出了一种多尺度卷积神经网络的图像分类算法。将自然图像利用空间金字塔匹配进行分解,逐个用卷积神经网络进行训练,同时为了避免过拟合用池化方法降维,最后训练Softmax多分类模型对图像进行分类。在公开数据库和自建数据库上进行实验对比,验证了基于多尺度卷积神经网络的图像分类算法对自然图像分类有更好的分类效果。该方法一方面全面考虑图像的多尺度信息,另一方面抽象地学习图像的低级及高级信息,使得输入分类器的特征能更为完整地表征图像信息。