基于空间自相关的空间数据挖掘若干关键技术的研究

被引量 : 20次 | 上传用户:WUST_SXC
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于计算机技术、网络技术、空间数据采集技术以及空间数据库技术等的迅速发展,使得复杂多变的空间数据日益膨胀,远远超出了人的解译能力。因此对从空间数据库发现空间知识的需求日益增长,于是出现了用于从空间数据库中进行知识发现的崭新研究领域——空间数据挖掘。空间数据挖掘指的是从空间数据库中抽取隐含的知识、空间关系或非显式地存储在空间数据库中的其它模式等。它是多学科和多种技术交叉综合的新领域,汇集了来自数据挖掘、机器学习、模式识别、空间数据库、统计学、人工智能、地理信息系统、遥感以及决策支持系统等各学科的成果。本文系统的介绍了空间数据挖掘的基本理论,比较传统数据挖掘与空间数据挖掘的不同之处。由于空间数据的特殊性,传统的数据挖掘技术已经不再适用于从空间数据库中有效地发现知识,只有研究新的理论、技术和方法,才能从空间数据库中挖掘出新颖有效的、能被人们理解的空间知识。针对空间数据的自相关性,本文重点对空间聚类、空间同位规则以及空间分类和预测进行了研究。本文的主要创新成果包括以下四个方面:(1)研究了如何进行高效空间聚类的问题。对DBSCAN算法进行改进,提出了一种改进的基于密度的抽样聚类算法(IDBSCAS),它不仅能够有效地处理大规模空间数据库,而且在聚类时既考虑了空间属性又考虑了非空间属性。该算法采用了一种新的抽样技术,不需要再对纯核心对象邻域中的每个对象都执行区域查询,从而节省了许多聚类时间;另外,通过引入匹配邻域的概念,使得该算法在聚类时,不仅考虑了空间属性也考虑了非空间属性,提高了聚类质量。2维空间数据测试结果表明IDBSCAS算法在聚类效果和执行时间上都比DBSCAN算法好。(2)研究了有效地挖掘正负空间同位规则的问题。尽管人们对挖掘空间同位规则做了一些研究,但大多数研究者仅仅对正空间同位规则进行研究,没有考虑负空间同位规则。提出了一种新的正负空间同位规则挖掘算法(PNSCLRMA),它不仅能挖掘正空间同位规则也能挖掘负空间同位规则。在该算法中采取了两项优化技术,第一,为了减少大量的连接操作,定义了星形邻域的概念;第二,采用了剪枝技术,只保留感兴趣的空间同位模式。实验表明该算法能有效地提取正负空间同位规则。(3)研究有效的空间数据预测模型。提出了在多元线性回归模型的基础上用于空间数据预测的模型(MLR*)。该模型在多元线性回归模型的基础上,首先通过在输入变量中加入空间信息,然后把新的输入变量输入多元线性回归模型来估计模型参数,最后再进行空间预测。实验结果表明,该方法能取得与空间自相关模型几乎相同的预测效果而且它的计算代价较小。(4)研究了基于模糊c-means算法的空间分类和预测。通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊c-means算法的空间数据分类和预测的方法(SFCM)。该方法首先用模糊c-means方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊c-means算法进行空间聚类时加入了空间信息。然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类。最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值。理论分析和实验结果表明,本文方法比空间自相关模型具有较好的分类和预测能力,而且本文方法具有更高的求解效率;另外,本文方法与CPFCM方法相比,其分类准确率比CPFCM方法的分类准确率明显要高,这也就说明在进行空间分类和预测时,必须加入空间信息。
其他文献
从我国改革开放以来的各产业产值比重变动与劳动力就业人口在三大产业之间的分布可以看出产业结构调整动态和劳动力转移趋势具有紧密的互动性。随着农业现代化的推进,农村劳
近年来,在教学手段逐步全球化与信息化的过程中,板书逐渐被多媒体等信息化手段取代,但课堂板书在小学英语课堂建构中仍然有着不可替代的作用。课堂板书用于教学过程中,能够让
本文介绍了国内外对线切割加工中断丝问题的研究简况,简述了产生断丝的原因,从线切割机床和工艺特点出发,对防止断丝进行探讨。
肾病综合征(NS)患者初期血黏度明显增加[1],加上激素和利尿剂的使用导致高凝状态[2],进而形成血栓,是难治性肾病的重要原因.本文对NS患者凝血酶原时间(PT),部分活化凝血酶时
壮族是广西人数最多的土著民族,瑶族在隋唐之际开始迁入广西。根据第六次全国人口普查,广西壮族人数接近1700万人,瑶族人口约有170万人。作为广西人口最多的两个少数民族,从
患者男,28岁。四肢红斑、丘疹、水疱伴痒1余月,累及全身10余天。查体:皮疹泛发全身,以躯干为重,表现为散在红斑、丘疹、水疱,红斑多呈环状,中央消退呈淡黄色,掌跖级口腔均受
会议
Cowl Point是汽车造型设计的关键硬点,为解决造型设计与工程设计冲突的问题,文章通过对新研发车型的Cowl Point造型设计引起的一系列工程设计问题进行分析,归纳问题存在的原因。
OFDM调制系统的调制解调可以用快速傅立叶变换实现,本文的目的就是研究如何应用FPGA这种大规模可编程逻辑器件实现适用于OFDM系统的FFT算法。本文首先从OFDM的基本原理着手,
学位
随着经济全球化和知识经济时代到来,全球高新技术企业得到迅速发展,高新技术企业已成为各国经济增长的重要推动器。高新技术企业具有不同于传统企业的成长模式和发展特点。近
指针是C语言中广泛使用的一种数据类型,函数是构成C语言程序的基本单位,在C语言中,将指针应用于函数进行程序设计,使函数的功能更加强大,函数调用也更加灵活,程序更加精练和