论文部分内容阅读
在现今信息时代,处于信息化智能化领域,信息技术带给我们生活便捷的同时,我们也不得不发现每天生活中接触的信息量是极其庞大的,包含空间定位信息的地理空间数据也应用在非常多的领域,空间数据朝着不断膨胀与庞大化的方向发展着。
随着地理信息系统(GIS)的发展,社会信息化需求的日益兴旺,地理信息系统软件必将处理越来越大范围内的大规模数据,海量空间数据高效的存储、检索、与空间分析操作一直都是GIS行业研究的热点与难点问题,也是各大GIS软件争相提升的创新问题。
为进一步提升GIS软件对海量空间数据的空间分析能力,为其提供理论储备和核心技术解决方案,本课题旨在从空间计算模式上,针对大规模矢量空间数据,提出一套提升GIS软件空间分析计算与存储、检索效率的模型方案,在不改动核心空间分析算法基础上、从上层模型层:对待分析的空间数据从数据形态上进行数据预规整,不同的空间分析操作概括出通用的优化预处理方案,对空间数据物理存储、索引进行设计优化,并且提出适应并行网格环境的框架策略。解决大规模空间数据的空间分析效率问题。
空间分析是GIS的灵魂,它提供了一系列数据操作功能,借助于这些功能,用户能够从原始数据中图示检索或条件检索出某些实体数据,还可以进行空间量算,叠加分析,以及对各类实体的属性数据进行统计,网络分析等。本文主要研究经典的空间分析算法,包括:叠加分析、多边形合并、线连接、裁剪运算、缓冲区分析等。
本文进行进行了如下几方面内容研究:(1)研究海量空间数据在裁剪、叠加、多边形合并等常见空间分析方面的特点。(2)对线、面空间数据,根据其形态特征,对数据合法性和优化性预处理。(3)针对裁剪、叠加、缓冲区等空间分析操作在数据规模过大时某些低效率情况,分析归纳出不同数据形态的空间分析操作优化方案。(4)研究空间数据的存储管理,从索引缓存、数据索引进行优化,提出优化方案并进行实现。通过研究索引缓存技术,以较低的代价扩大索引信息的数量,改善数据搜索效率。(5)本文提出分布式空间运算的总体框架,并行和分布式是快速空间数据处理的发展方向,本文的海量数据下的空间计算模式也必须能够长足发展并且适应分布并行的计算环境。
最后我们给出实验室环境的并行网格实现,在数据规模较大时得到了较好的效率结果。