论文部分内容阅读
数据采集技术的快速发展,形成了“数据的海洋”。如何快速的从中提取出有用的信息和知识,促进数据的自动化处理、智能分析和决策支持等,成了人们迫切需要解决的问题。事务或关系数据库中的数据挖掘理论、技术、方法和应用已经得到了充分的发展。空间数据因其非结构化特征而与一般事务数据区别,空间数据挖掘技术也比一般数据挖掘技术更为复杂。但据专家估计,空间数据约占信息总量的80%左右,可见空间数据挖掘意义重大而任务紧迫。 地理信息系统(GIS)是近年来空间数据管理和分析的主要方式,虽然空间分析被认为是GIS的灵魂和关键,但它目前仍然缺乏对空间数据中隐含的各种空间模式、空间关系和空间分布规律的自动发掘能力。空间数据挖掘技术将一般数据挖掘技术应用到空间数据中,结合GIS强大的空间分析和操作能力,实现在大量的非结构化的空间数据中,发掘出隐含的、潜在有用的空间特征和空间模式,从而为信息管理、科学研究、空间决策等提供相应的空间知识服务,也拓展地理信息系统的应用广度和深度。 林业是地理信息系统的传统应用领域,国内各级林业部门正在掀起信息化浪潮,林业GIS在其中扮演了重要的角色,也必将积累大量的林业空间数据。林业GIS中的森林资源数据,反映区域内森林资源现状和动态变化,具有来源广、类型多、数量大、变化快、难以管理等多方面的特点。如何有效管理和分析这些数据,并从其中获取空间知识,对林业管理、规划和决策提供科学依据等非常重要,也是关系社会经济可持续发展等国计民生的大事。 本文在概述和总结有关空间数据挖掘理论与方法的基础上,针对包含基础地理要素和林业专题要素的地图分层数据集,在GIS开发平台上设计和开发一个空间数据挖掘原型系统,侧重于空间特征规则、空间关联规则和空间分类规则的实现,并用实验数据进行系统性能的验证,试图将产生的空间知识规则应用到有关林业决策和分析中,显示了所得知识的有效性和应用价值。第一部分回顾了DMKD和SDMKD的产生、发展现状和趋势;第二部分比较详细的叙述DMKD的有关理论和SDMKD的含义、可以发现的知识类型、现有的技术方法以及SDMKD系统的一般结构;第三部分是本文讨论的重点之一,简述了林业GIS数据特征和组织方式,分析适合于林业GIS数据特点的空间数据挖掘技术与方法;在上述分析与论证的基础上,以比较通用的GIS组件MApX、可视化编程语言Visual Basic为平台,大型关系型数据库管理系统sQL server及空间数据库引擎spatialware(凡r sQL Server)为基础,设计并实现了一个林业数据挖掘原型系统;第四部分是本文讨论的重点之二,选取研究区域的森林资源数据,运用上述设计和实现的原型系统,进行森林资源特征规则、关联规则和分类规则等三种知识规则发现的实验研究,并对实验结果进行分析与评价。结果表明,实现的原型系统能够在大量的森林资源数据中发现大量的规则知识,但知识的有效性、合理性以及发掘过程中的一些算法尚待研究和改进。第五部分结合林业数据挖掘的实践,对空间数据挖掘及其在林业领域中的应用进行总结和展望。 由于水平所限,加之时间和精力不足,笔者对空间数据挖掘的理论和技术理解还很不深刻,所做林业数据挖掘的理论与实验研究可以说是在该领域的初步探索,有待进一步加深和扩展。