论文部分内容阅读
农业生产是一个复杂、动态、开放的系统,其影响因素多,时空状态变化大,涉及大量具有空间分布特征的数据(土壤、气候、水文地质等)。随着计算能力的日益增强和环境信息数据获取与解析技术迅速发展,大规模的农业数据的获取较以往更为方便和普遍,多年的积累使各科研单位掌握了相当数量的农业生产数据、土壤品质数据、气象和水文观测数据等农业空间数据。但从数据利用的角度来看,由于这些数据庞大、复杂,冗余度大,且具有明显的时空分布特性和高维特征,从而使农业空间数据难以得到有效的利用,造成了数据资源的极大浪费。要使如此大量的数据真正成为一种资源,而不是成为数据包袱和垃圾,有效地解决数据复杂性和利用有效性的矛盾,于是从大量数据中自动、快速、有效地提取能反映源数据本质特点的特征提取技术便应运而生,并得以迅速发展。地理信息系统(Geographic Information System,简称GIS)作为农业空间数据管理与分析的重要手段已得到广泛的认可和重视。地理信息系统的出现,使农业空间数据的特征提取成为可能。在空间数据库平台的基础上,可将传统特征提取技术引入GIS,从而成为农业空间数据特征提取技术。然而,农业生产是一个复杂性系统,有其自身特点,其影响因素蕴含着复杂非线性结构机制,面对这一复杂系统产生的海量数据,特别是大量的时空数据,传统的特征提取方法已暴露出它的局限性。要发挥出农业空间数据最大的使用效益,就必须有效的提取出农业空间数据的非线性结构特征。核主成分分析(Kernel Principal Component Analysis,简称KPCA)是近年来进行非线性特征提取的重要研究方向。由于它为解决非线性问题的特征提取提供了一个较坚实的核理论基础,从而有望帮助解决传统方法难以解决的问题。本文围绕如何根据农业领域的数据特性实现其特征提取展开研究与讨论。提出了基于GIS和KPCA的农业空间数据特征提取方案。首先,讨论和分析了GIS在农业空间数据特征提取中的应用和不足。其次,通过对KPCA方法的深入研究,阐明KPCA是一个适用于非线性结构特征提取的方法,尤其适用于具有时空分布特性的农业数据。第三,在前两步工作的基础上重点探讨了KPCA的核参数选择方法,对多种算法进行分析比较,指出各自的性能和适应范围,并针对KPCA最优核参数的特性提出了一种旨在提高KPCA特征提取性能的核参数选择算法。最后,针对农业领域的数据特性和特征提取的过程,结合前几步的研究结果提出一种基于GIS和KPCA的农业空间数据特征提取模型。以重庆市植烟区为例,对重庆市植烟区气候数据进行特征提取分析,并根据所提取特征进行空间模拟分析,从而形成影响植烟区的农业气候时空变化图。基于核的特征提取研究仍然处于起步阶段,它在农业领域也还有许多问题值得探讨。本研究提出的基于GIS和KPCA的农业空间数据特征提取试图为我国农业数据资源的利用提供一种新的认识和途径。