论文部分内容阅读
随着数据获取技术的发展以及数据获取手段的多样化,大量与空间位置相关的数据被收集,人们迫切需要强有力的数据分析工具来从这些数据中获取信息或知识,这一需求导致了空间数据挖掘这一全新研究领域的出现。 空间聚类分析既可以发现隐含在海量数据中的聚类规则,又可以与其它数据挖掘方法结合使用,发掘更深层次的知识,提高数据挖掘的效率和质量,是空间数据挖掘的重要研究方向之一。本文探讨了面状地理实体和栅格空间数据的聚类算法,主要研究工作如下: (1)系统归纳和总结了文献中发表的大量空间聚类算法,对各种算法的适用条件、性能、优缺点和计算复杂度进行了细致分析与比较。 (2)分析了面状地理实体的特点,针对面状地理实体提出了一种顾及几何形状相似性的简单多边形之间最近距离计算方法。该方法具有以下优点:①适用于简单多边形之间距离计算;②在得到多边形之间最近距离的同时,得到多边形之间彼此面对的线段链,为进一步求取多边形之间几何形状相似性奠定了基础。 (3)提出了基于遗传算法的面状地理实体划分聚类算法。算法在搜索过程中不需要其它外部信息,仅以适应度函数为依据,利用种群中每个个体的适应度来搜索最优解,具有普适性较好、聚类结果质量高的优点。 (4)针对聚类数未知条件下面状地理实体的聚类问题,提出了基于簇分解的面状地理实体聚类算法和基于聚类有效性函数的面状地理实体聚类算法。验证了两种算法的各项性能指标。 (5)提出了满足旋转与平移不变性的线段链相似性评价方法。该方法具有计算简便,不需要针对每对线段链进行优化计算的优点。依据该评价方法,设计了面状地理实体聚类算法CACSS。提出了综合考虑距离与几何形状相似性的面状地理实体相似性准则,依据该准则改写了基于遗传算法的面状地理实体聚类算法和CLARANS算法。 (6)将小波多分辨率分解和Kmeans算法有机结合,提出了一种既能改进算法效率,又能保证聚类结果质量的新聚类算法WaveKmeans。