论文部分内容阅读
随着我国社会经济水平的提高和人们对客观世界认知的深入,地理信息产业逐渐得到重视。在“数字中国”和“智慧城市”的推动下,基础地理信息数据普查和测绘工程取得了重大成果。在新的信息化浪潮下,测绘部门等相关政府职能部门全力做好基础测绘等工作,构建大的地理信息服务平台,与此同时,各行各业都尝试着本行业的信息化和智能化工作,“智能电网”、“智能水网”等已经逐渐成熟起来。支撑起这整个巨大的信息化工程的,是对客观世界进行描述的海量空间数据。随着传感器技术的成熟,物联网开始兴起,这势必会急剧增加空间数据的获取量和积累量。在大数据时代,对于大数据的存储、处理、传输和共享等方面,在计算机科学领域已经研究并使用分布式计算和存储、格网计算、NoSQL数据库、Web Service等许多理论和技术。但是在地理信息系统领域,数据存储还是以文件系统和关系型数据库为主,数据处理还是以桌面软件为主,可以看出来,地理信息领域还没有做好适应大数据时代的准备。多级格网理论是对地理格网的优化和升级。多级格网以基本格网划分地理空间,可以实现快速的空间查询,还可以与分布式存储和计算的节点相对应起来;以细分格网来表示地理坐标,统一了空间参考系统,可以对多源数据进行整合。以多级格网为框架,对空间数据进行组织与管理,可以有效地解决多源数据整合和共享,海量空间数据分布式存储计算等问题,是大数据时代应对空间大数据的有效理论和途径。本文从大数据这一时代背景出发,研究分析了空间数据所具有的数据量大、多源异构和数据结构复杂等三个特征,并提出了空间数据组织的要求。分析介绍了多级格网框架的基础理论——地理格网参照系统相关理论、多级格网理论的核心和关键点、数据组织的技术实现基础——NoSQL数据库技术三方面的内容,为多级格网框架下的数据组织模式打下理论和技术基础。本文论证选取了多级格网框架的空间参考系统,并确定了基本格网和细分格网的划分方法和划分等级,参照GeoHash编码和Base32编码,结合多级格网的划分方法,提出一种新的格网编码方法。本文的格网编码方法既可以体现多级格网理论思想,又与实际的实现技术相适应。随后给出了格网编码与WGS-84坐标相互转换的算法,并以实例分析了转换过程中存在的精度问题。在多级格网框架理论的基础上,从数据存储的内容和形式方面对空间数据所需要存储的具体内容和存储的具体结构进行了分析和确定,以NoSQL数据库技术作为主要的数据组织实现技术,以MongoDB数据库作为主要的存储载体,对空间数据进行了组织与存储。本文最后对空间数据在多级格网框架下的共享和分布式计算进行了简要的分析,并构建了空间数据共享和分布式计算的框架。