基于互联网的地理实体信息获取关键技术研究

来源 :解放军信息工程大学 | 被引量 : 7次 | 上传用户:yyyyoooouuuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息资源的爆炸性增长,各行各业的数据都充斥在互联网这个海洋里。地理实体信息采集主要依赖国家的地理信息普查、实地测量和调查,费时费力,难以满足地理实体信息快速采集与更新的需求,而互联网上丰富多样、源源不断的信息为地理实体信息的快速获取提供了有力的支撑。本文通过对地理实体位置数据和地理实体属性数据的互联网获取相关理论和技术的研究,建立了一个基于互联网的地理实体信息采集原型系统。论文的具体研究内容如下:1、通过对地理实体信息采集背景的分析,指出了基于互联网采集地理实体信息的重要性;介绍了Web地理信息的互联网分布现状和Web地理信息获取的研究现状;从文本信息中的地理实体信息出发,分析了信息抽取的研究现状。对地理实体相关概念进行总结,并对比了地理实体信息与基础地理信息、POI信息的异同;对信息抽取领域的相关概念、抽取内容、方法进行了介绍;结合地理实体概念和信息抽取理论,对地理实体的位置数据和属性数据的获取进行了介绍,提出了地理实体信息互联网获取的技术方案。2、针对地理实体位置数据互联网获取,提出了基于POI的全球地理实体位置数据获取方案。国内针对百度地图、高德地图,分别利用百度地图和高德地图API实现了对指定任意区域全部类别POI的快速获取。国外利用OSM地图进行了相关研究和试验,提出了通过数据格式转换获取和根据OSM数据中的<key,value>抽取POI数据两种获取方案。最后,结合三种数据的不同特征,对百度地图和高德地图POI数据进行融合,对OSM数据进行转换,实现了基于POI数据生成地理实体的位置数据。3、基于互联网的地理实体属性数据结构化获取,依据属性抽取相关理论和地理实体属性信息所在百科文档的特点,对基于半结构化文本和非结构化文本的地理实体属性抽取进行了相关研究。前者是基于百科信息框的地理实体属性抽取,通过属性归一化和文本规则匹配抽取地理实体属性;后者是利用机器学习理论,提出了基于弱监督的条件随机场抽取地理实体属性的方法,利用前者抽取得到的地理实体属性对非结构化文本自动标注,生成训练集,然后利用条件随机场模型生成地理实体属性特征模型,利用模型对非结构化文本中地理实体属性进行预测抽取。最后对以上两种方法设计了相关实验进行了验证。4、依据地理实体信息互联网采集的现实需求,本文以丰富多样的互联网基础地理信息服务为基础,将上述地理实体位置数据获取和属性数据获取的技术和成果进行集成,设计并实现了一个地理实体信息互联网采集的原型系统,对上述研究成果的应用的同时实现了基于互联网的地理实体信息一体化采集。
其他文献
中职学生不同于高中或者是高职学生,他们的文化理论基础以及学习能力较为薄弱,所以中职语文课程要注重提高学生的学习能力以及文化知识,以促进学生全面综合素质发展,转变传统
目的探讨卡前列素氨丁三醇联合卡贝缩宫素治疗宫缩乏力性产后出血的疗效。方法选取我院2017年9月至2018年9月期间收治的宫缩乏力性产后出血患者180例,随机分为联合组和对照组
空间数据组织与索引是空间信息技术应用的基础。随着智慧城市的快速推进、VGI(Volunteered Geographic Information)及 LBS (Location Base Service)应用的迅速发展,空间数据
课程目标作为整合教学资源,改进学习方法,增强教学功能,促进核心价值观培育和实践的有效载体,在高中数学教学领域中,起到了至关重要的调整、导向和驱动作用.本文以新课程理念
本文拟分析供给学派理论形成的经济学背景与经济传导机制以及经济效应,以此对我国"新常态"下减税政策的制定与实施提供理论指导与政策指引,并为我国"新常态"下的经济运行提供
目的分析黄芪桂枝五物汤加减治疗糖尿病周围神经病变的临床效果。方法遴选我院于2013年9月至2018年9月收治的40例糖尿病周围神经病变患者,随机分为对照组(n=20)和治疗组(n=20
目的探讨对吸入性肺炎患者施行头孢美唑治疗的临床疗效观察。方法选取我院2017年1月至2018年11月收治的吸入性肺炎患者共48例作为研究对象,将其随机分为观察组和对照组,设定
低龄老年就业对于促进我国产业结构升级,提升社会保障制度的可持续性和老年人自我保障能力具有重要意义。我国老年就业主要集中于第一产业、男性比例明显高于女性、年龄段主
期刊