基于改进GMM聚类算法的Hilbert-R树构建方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xx19890701
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着地理信息系统的快速发展,空间数据库在很多应用领域得到了发挥。空间数据具有复杂性、多样性、海量性等特征,基于B树的传统关系型数据库不能实现良好的存储和快速访问。因此,空间索引技术应运而生。如何能够实现良好的索引结构和减少冗余查询路径是当前空间数据库的研究热点和难点问题之一。R树是一种空间索引结构,用最小外包矩形近似表示空间数据,能够对空间数据进行有效的存储和访问。Hilbert-R树是R树的变体之一,采用分形几何技术,对空间多维数据进行降维操作,减少计算量,达到快速构建索引的目的。但是Hilbert-R树中的数据经映射后,原本物理空间中邻近的对象可能不在一个叶子节点中,在最近邻查询时会出现误差或冗余路径,降低索引质量和效率。针对现有传统和改进的空间索引的不足,本文主要分以下三个方面进行研究:1、针对Hilbert-R树映射后物理空间邻近数据点可能不在一个节点的不足,首先采用聚类算法GMM(高斯混合模型)对空间数据进行预处理,GMM能够实现簇内数据相似性高,簇间数据相似性低,使得邻近的数据在同一个叶子节点中。而且,由于节点间相似性低,从而降低MBR(Minimum bounding rectangle)的重叠度,提高索引效率。2、针对GMM算法中存在任意初始值和局部最优解的不足,提出利用层次聚类算法CURE对数据进行划分操作,经迭代数层后得到数据的期望和方差。此时的期望和方差由于不再具有任意性,可作为GMM算法的初始值,避免噪声点或离群点对簇的影响,提高聚类质量,进而使节点内数据分布更加紧凑,提高查询效率。采用蜂群算法弥补局部最优的不足,提升整个Hilbert-R树索引结构质量。3、针对现有空间不确定数据构建索引的不足,利用基于改进的GMM算法生成Hilbert-R树,减少积分运算量。同时,由于采用自底向上的静态批处理方式,使得整个Hilbert-R树除根节点以外的数据都是满容量的,提高索引的空间利用率。良好的索引最终目的是有效的查询,因此本文提出聚类和Voronoi图相结合的方式,裁剪不确定数据,降低查找对象的时间,提高索引效率。
其他文献
以认知语言学为依托,用原型范畴化理论和意向图式分析方法对英语介词"out"的空间隐喻拓展进行认知研究。介词"out"以"空间"概念为原型,以隐喻为手段,利用家族相似性不断向外拓展和
随着科技的发展,PLC技术在煤矿电气自动化中的应用越来越广泛。根据实际应用情况,PLC技术的应用有效提升了煤矿的生产效率。因此,研究PLC技术在煤矿电气自动化中的应用意义重
煤矿企业工作效率的提高和生产安全性的保证都和数字技术在煤矿电气自动化中的应用有关。论文对煤矿电气自动化数字技术应用的特点和意义进行了分析,并为推进相关应用提出了
报告20例既往健康的成人巨细胞病毒性肝炎,占同期住院急性肝炎总数的1.08%,表现为全年散发、急性起病、发热(10例)、黄疸(14例)、肝功能损害(20例)。提示既往健康成人患急性肝炎而原因不明时,应考虑
研究目的本论文旨在对猫爪草粗多糖进行系统的分离,以期得到的猫爪草多糖组分、多糖亚组分和均一多糖成分,并对分离产物进行理化性质的测定,同时采用体内和体外模型,评价猫爪草粗多糖、多糖组分、多糖亚组分和均一多糖成分的抗肝损伤和免疫调节活性,为今后猫爪草多糖的研究和开发提供实验依据,以及为“灵猫方”的开发奠定基础。实验方法实验中采用水浴提取/煎煮、醇沉、透析和冷冻干燥等方法,制备猫爪草粗多糖;采用DEAE
以鸡腿菇为材料,菌落总数为研究对象,采用中心组合设计响应面分析法研究了超高压处理对鸡腿菇菌落总数数量级的影响。建立了以温度、压力和保压时间为参数的超高压影响鸡腿菇菌
文章在分析1995年以来中国外贸转型升级情况的基础上,通过构建VAR模型,实证分析知识产权保护对中国外 贸转型升级的影响,结果表明:我国外贸转型升级整体上保持上升态势,但存在
本品是色泽金黄、外脆内嫩、酥松可口、形似蛋糕的风味食品.被称为"米蛋糕".其制作工艺如下.
期刊
黑米蛋糕制作技术李慧东黑米、黑芝麻等黑色物质中含有丰富的营养成分和特殊的药物成分。因此,以它们为原料制成的黑色食品,近年来风靡世界,倍受人们青睐。黑米蛋糕集黑米、黑芝
故事$$ 《威尼斯商人》是莎士比亚早期的重要作品,讲述的故事如下:$$ 犹太人夏洛克是一名威尼斯商人,以放高利贷为生。有一天,安东尼奥为了帮助好友巴萨尼奥娶妻,以自己那尚未回
报纸