论文部分内容阅读
随着遥感对地观测技术的发展,硬件设施日益完善,能够获取并采集分辨率越来越高的遥感图像,这些高质量的图像可提供更多的空间、形状、和纹理信息。这些丰富的地物信息在精细农业、城市规划、地籍调查、自然灾害检测等诸多领域有着广阔的应用前景。由于遥感图像包含的信息量比较多,而且数据应用情况远滞后于其数据获取能力,所以如何把这些海量的图像进行快速的分类是加快遥感图像利用效率的关键所在。传统的机器学习算法(如SVM、决策树、随机森林等)是以人工设计的特征描述子来提取特征,然后用分类器将这些特征进行分类。算法的关键步骤是将图像中包含的特征信息提取出来,然后做进一步的分类。但由于遥感图像数据的空间复杂性、多样性等特性使得人工设计的特征很难从图像中提取到准确的有价值的信息,所以这些算法达不到应用需求。虽然有的时候针对某些小样本的数据也可以取得不错的效果,但当遇到批量大、复杂的图像数据的时候,由于计算能力有限,其泛化能力和分类效果仍然难以满足应用需求。随着深度学习算法的快速发展,工业、医疗、社会、安全等很多领域的生产效率获得了大幅度的提升。卷积神经网络的优势在于它可以用数据驱动的方式来提取图像数据的特征,在所有遥感图像场景分类问题的众多解决方案中脱颖而出,而且已被广泛的应用到图像分类、语义分割和目标检测等计算机视觉领域中。但在某些特定的应用场景中,网络的分类精度仍有待提高,而且随着网络参数的增加,硬件设备的计算成本和时间开销也越来越大,达不到实时预测的能力,这也给遥感图像场景分类模型的实际应用过程中的落地部署带来了极大困难。针对上述问题仍需要对CNN网络结构优化以取得更好的效果。本文的研究主要包括以下内容:(1)具体地介绍了卷积层、池化层、全连接层、批量归一化、前向传播、反向传播等卷积神经网络的重要理论概念,最后为如何解决过拟合问题提供了思路。另外,针对当前主流卷积神经网络的结构进行了详细的研究和探讨,并在当前分类性能比较优越的DenseNet网络基础上进行改进,提出了一种监督训练的方式对其结构进行改进,把原有的Densenet网络的第3个dense层的输出做池化操作后加上一个全连接层,然后加一个新的损失函数,再与第4个dense层的最后的损失函数相结合,将这两个损失函数相加作为最终的损失函数并采用softmax分类器进行输出。然后将改进后的DenseNet网络和主流的卷积神经网络一起在NWPU-RESISC45数据集和AID数据集上进行测试对比并统计了各个网络的分类准确率,结果发现分类准确率最高的是改进的DenseNet网络,由此证明了该网络结构的优越性。(2)针对当前大型网络在工程化落地过程中的种种问题,如模型过于庞大致使嵌入式设备的存储空间面临挑战,或目前移动端的硬件设备无法满足深层网络模型对于算力(FLOPS)的要求,本文对DenseNet模型进行压缩,借鉴了MobileNet的深度可分离卷积的计算方式,对DenseNet的卷积模块进行改造,并降低网络超参数growthrate的值,接着进行一系列网络深度对比测试,然后通过混淆矩阵和准确率两种精度评价方式,验证了经压缩后的DenseNet模型不仅消耗的计算资源少,而且其准确率也取得不错的效果。(3)使用卷积神经网络对遥感场景图像进行分类虽然取得了不错的效果,但在实际应用的过程中,我们往往会在硬件设备固定的计算资源下进行操作,即使网络性能再强大,如果超出计算成本,那么网络模型也是不可用的。如何在给定计算资源的条件限制下设计出更好更优的模型显得尤为重要。基于这个问题,本文提出一种同时调整模型宽度和深度的模型扩充方法,并通过实验证明,协调调整网络的宽度和深度比单纯的调整其中一个可让模型取得更好的分类效果。