论文部分内容阅读
随着科技的进步,每天有越来越多的影像数据被发送回地表,其中70%是关于城市的影像,而城市中又有70%是人工建造的建筑物。虽然计算机和科学已经有了长足的发展,但是快速稳健的高分辨率遥感影像建筑物提取依旧是相关学科中的一个研究热点。传统的建筑物提速算法使用基于人工设计的特征,对于特定形状的建筑物检测效果较好,但复杂情况的处理效果上有待提高。近年深度学习的发展突破了物体识别和目标检测的瓶颈,因此本文使用基于深度学习的建筑物检测方式,采用先识别后定位的思想,利用卷积神经网络构建建筑物识别和检测模型,通过自建数据集训练,较好的解决了高分辨率遥感影像中的建筑物提取问题。本文研究使用深度学习进行高分辨率遥感影像中建筑物检测。使用来自谷歌Earth和百度地图的影像作为实验数据。首先设计了两个网络并进行训练用于测试网络深度对于精度的影响,之后针对其中一个网络进行多次微小改进测试网络各层对于精度的影响,以及如何提升现有的精度。通过实验发现在数据不足的情况下,使用预训练的模型在自建数据集上进行微调可以达到比自己网络更好的精度。接着使用反卷积查看网络学习到了什么特征并对超参数调整起到参考。接下来使用名为网络2的卷积神经网络作为特征提取器,并改进了现有的Fast R-CNN算法使用在建筑物的检测上,同时将两个检测网络进行训练,并将各自结果进行融合快速准确的检测出了影像中的建筑物。相比Fast R-CNN,本文方法在保证速度的条件下得到了更好的精度以及容错能力。本文算法过程:数据预处理、建筑物候选区提取、候选区识别、候选区建筑物边界回归。使用C++和python完成了本文的数据标注,数据序列化,网络训练推理的实验。实验表明本文使用的基于深度学习的高分辨率遥感影像建筑物提取算法可以快速准确的完成建筑物的检测和识别。文中改进的Fast R-CNN检测算法相比Fast R-CNN算法,在保证速度没有衰减的前提下提高了检测精度。除此之外,提升了网络的鲁棒性和容错能力,而且算法几乎满足实时检测的要求。相比于现有的研究成果,在提取精度、算法效率上均有提升,而且使用条件更加宽松,这也表明本文方法的有效性。