论文部分内容阅读
地名信息研究是应用地名学的重要部分,它的不断发展和进步正影响着人们对地名问题的思维方式,推动着地名研究和地名管理的现代化。随着空间位置信息在社会信息关联应用中的逐步推广,承载着时空属性等多种要素和各种各样专题信息的地名,正逐渐成为社会信息关联网络的核心。本文以中文文本为数据源,从语言、历史、地理角度分析地名信息要素的描述特征,借助GIS时空框架制定和数据组织能力,提出地名要素关联方法,为信息化背景下地名信息获取、组织和应用服务提供基础。本文主要研究内容和成果包括以下几个方面:(1)地名信息特征分析与语义模型分析和总结了中文文本中地名信息要素的语言描述特征,以基本信息、实体属性信息、空间位置信息、演化信息以及其它元数据信息为依据将地名信息分为五大类,构建了完整的地名信息模型,为地名要素语义关联网络的组织和挖掘提供基础。(2)地名信息抽取方法提出融合语言特征的地名名称抽取模型,通过正则表达与规则模型抽取地名基本要素、实体特征以及时间信息,并最终形成机器学习和模式抽取相结合的地名信息抽取方法,便于地名要素解析与关联。(3)地名要素关联方法在分析和抽取地名信息要素基础上,挖掘地名要素在描述特点、空间分布、匹配逻辑、时空演绎、作用机制中的作用和关系,通过替代性地名解析、空间匹配、空间关系解析与时空演化反演,建立通用地名要素信息间的关联。然后,提出专题地名要素关联方法,解决地名承载的多样化专题信息与通用地名要素之间时空映射的问题,从双向层面扩展了地名信息和专题信息的应用价值。(4)应用实例分析以南京市地名大全数据为基础,通过示例验证地名要素挖掘与关联方法的可行性。结合地名名称、含义、历史沿革等要素信息分析南京地名景观特征。对南京市辖区时空演化过程进行分析。为人物、事件信息与地名要素之间的关联提供应用示例。