空间数据挖掘中若干关键技术研究

来源 :长安大学 | 被引量 : 9次 | 上传用户:nwhitewolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间数据挖掘(Spatial Data Mining,SDM)是指从空间数据库中抽取隐含知识、空间关系或非显式存储在数据库中有意义的特征或模式。该技术在理解空间数据、获取空间与非空间数据间内在关系方面具有重要意义。由于近年来空间地理信息系统(Geography Information System,GIS)广泛地应用到各个行业中,积累大量与空间位置相关的空间数据,因此空间数据挖掘研究己成为当前研究的重要课题。本论文正是在这种背景下,在系统地讨论空间数据挖掘的基本理论的基础上,对空间数据挖掘的若干关键技术进行重点研究,论文研究成果可归纳如下:1.在总结已有研究工作的基础上,研究了位置-属性一体化的实体信息模型,并分析了3种空间距离测度,可以作为空间计算的基础准则;通过对空间权重矩阵进行拓展,介绍了空间实体关联矩阵的概念,并分析建立方法,为空间数据挖掘提供了新的基础工具。2.描述了基于模型聚类的混合模型和基本的期望最大化算法(ExpectationMaximization,EM)算法,尽管EM算法具有普遍性,但是它在实际应用中还是常常受到计算效率的限制。EM算法每一步的迭代中需要遍历所有的样本点。如果数据集非常大,则计算强度也会增加。因此,提出了基于随机子样本的节省计算的递增EM(IncreasingEM,IEM)算法,该算法运行在子集而不是完全样本集上,每一次迭代中,只有较少的样本点需要被估计,这使得算法在运行时间上具有可观的改善。通过EM高效的似然判断条件和增量因子,可以对样本子集的容量自动选择。IEM算法提高了计算效率,并且不需要牺牲似然估计的精确度。3.由于EM算法不适合空间聚类对空间信息的要求,而邻域EM(Neighborhood EM,NEM)算法虽然结合了空间惩罚项,但是NEM在E-step步需要大量的迭代。为了既能满足空间信息的要求,又能避免过多的计算量,利用IEM的思想,提出了EM与NEM二者相结合的混合递增NEM(Mixed Increasing EM,MNEM)算法,算法首先在随机子样本中进行EM训练,直到似然判断条件下降,根据增量因子进行样本更新,然后样本转向NEM训练一次,如此进行循环递增的交叉训练,使得计算量降低,性能提高。4.在包含被相关属性集合所描述的谓词的空间数据库里,进行多概念级空间关联规则挖掘。一个多级关联规则模式是一个频繁谓词集合,在这个集合里,所有构成谓词的项目分别有一个确定的概念层次。本文提出了在空间数据库中挖掘多概念级空间关联规则的新算法,该数据库中存储了经过空间查询和空间计算所获得的空间谓词,并且依据关系表R的空间关系建立母元素表和频繁类匹配表,这使得多概念级空间关联规则挖掘更加方便和有效。5.方位信息是图像数据库中最重要的信息类型之一,而9DLT(Nine DirectionLower-Triangular Martix)表达形式是方位表达的基本方法,据此提出了一种在图像数据库中根据空间方位关系挖掘空间关联规则的(9DLT Image Mining,9DIM)算法,在这里每幅图像都被初始化为9DLT字符串,形成类似于事务数据库的图像模式数据库,每个9DLT字符串(图像)代表一个事务。以图像对象之间的关系模式,建立频繁k-1(k>2)模式库,并由频繁k-1模式库构造频繁k模式树的方式,依次可以发掘到所有对象间的频繁模式。比Apriori算法更加有效。
其他文献
随着信息技术的不断进步和发展,网络对当今高职高专院校大学英语教学产生了深远的影响。网络资源在高职高专大学英语教学过程中的合理利用,以及网络资源与英语教学的有机整合,有
语言输入假设、输出假设和吸收假设是二语习得理论的重要组成部分。从发展时间来看,先有输入假设,后有输出假设,最后提出吸收假设,后者是前者的升华。考虑到三者之间的逻辑联系,本
城市的快速发展,越来越重视科技设施的建设,科技馆作为科技设施的一项内容,对国民的科技文化素质起着重要影响。科技馆要想取得更大效益,首先要提高自身的服务水平。通过对如何提
随着新时期高校图书馆工作内容和服务方式的不断发展变化,人力资源管理模式只有不断创新才能适应高校图书馆现代化发展需要。本文深入分析高校图书馆人力资源管理现状及创新改
城市道路是城市空间及各功能区连接的枢纽.在新时代的背景下,我国城市经济得到了空前发展,原有城市道路横断面设计已不能适应新形势发展需要.因此,研究城市道路横断面形式确
本文在EPMM的基础上,建立了以CCS为主要形式工具的软件演化过程的元模型CEPMM,它以任务不可分割为前提,支持软件演化过程全局层、过程层和活动层的形式建模与验证。本文致力
在如今,时代的进步促使水文资料的运用得到普及,进一步的对水文资料的精确程度以及便捷程度的要求变高。加之当今社会发展,科学技术的发展,对水文资料的需求日益增加,也对它的精确
为确保库尔勒石化产业园建设,对工业园区水资源现状及开发利用潜力进行分析,以区域水资源配置格局为前提,在深入分析产业园用水需求的基础上,利用水平衡分析方法,从区域角度
经济法是关于社会整体经济利益分配之法,经济法所调整的社会整体经济利益的权衡、确认和保障活动实质上是一种利益的再分配活动。经济法的利益再分配功能首先体现在其对经济