中文文本中GIS空间查询信息抽取方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:lmjgood520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本作为最常用的一种自然语言的载体,是一种重要的原始空间数据来源,蕴含了大量的GIS(地理信息系统)空间查询信息。从文本中获取未分析、非显性的空间知识已成为当前地理信息科学迫切需要解决的问题。本文在详细综述国内外相关研究进展的基础上,重点探讨中文文本GIS空间查询信息抽取方法。主要内容包括以下几个方面:   (1)中文文本中GIS空间查询信息表达   在探讨了空间操作理论和GIS通用空间操作分类体系的基础上,研究了中文文本中空间查询信息的表达。GIS空间操作作为空间查询信息的重要组成部分,是空间查询信息GIS表达的重要基础,通过设计了GOML(空间操作标记语言),实现中文文本查询信息的规范化表达。   (2)GIS空间查询信息的语料标注与分析   在地理命名实体和空间关系标记语言及标注规范的基础上,采用GATE(自然语言处理开放式平台)平台进行GIS空间查询信息语料的标注工程。首先,从空间关系标注语料库中获取文本中常用的空间查询操作词语,将其作为小样本,使用HowNet(知网在线系统)从现代汉语词典中扩充空间查询操作词语,构建空间查询操作词典。然后,通过对实验语料的空间查询信息标注分析,总结常用的GIS空间查询信息的句法模式,将其编写为GIS空间查询信息JAPE(a Java Annotation PatternsEngine)抽取规则。   (3)基于规则的GIS空间查询信息抽取方法   利用JAPE抽取规则对实验语料进行自动抽取实验,验证基于GATE的中文空间查询信息抽取及其抽取结果GIS表达的可行性。实验分为三阶段:1)利用总结的JAPE抽取规则抽取标注语料,对比抽取结果,完善空间查询信息JAPE抽取规则;2)利用完善的JAPE规则抽取实验语料,其抽取准确率、召回率分别为68.3%、87.2%;3)用实验展示中文文本空间查询信息的GIS表达。
其他文献
地貌作为地理环境中的一个重要因素,它与人类生产活动关系非常密切。在过去很长的时间里,受GIS计算机软硬件技术和GIS基础理论的限制,地理信息系统主要以描述二维空间信息为
历史文化村镇是“保存文物特别丰富并且有重大历史价值或者革命纪念意义,能较完整地反映此历史时期的传统风貌和地方民族特色的镇(村)。村镇经过几千年物质和文化的积淀,形成独
人口分布和交通可达性有着十分密切的关系,某一地区可达性提高将会促进人口和经济活动的集聚,相反若一个地区的交通可达性无法适应当地的人口分布格局,轻则加重运输压力,重则
随着科技全球化的加速以及技术更新周期的缩短,跨国公司全球战略目标逐渐从效率成本转向创新学习能力的实现,全球扩张战略重点也正由传统的市场寻求、资源寻求和效率寻求转向战
经济活动地理集中是一种普遍的空间现象,有竞争力的产业(企业)往往集聚在某些特定地区,主宰着地方经济发展的格局。作为经济学和地理学研究的一个重要领域,产业地理集中是20