论文部分内容阅读
地址是某一特定空间位置上自然或人文地理实体位置的结构化描述,提供一种关于人、构筑物及其它空间物体的定位实现。以地名/地址信息作为基础,进行标准地址库构建,能在统一的地理参考框架中,建立标准和非标准地址信息之间有机的联系,实现空间信息和非空间信息的融合,满足直接、实时地址数据共享要求,实现不同地址数据类型、不同系统之间的集成。针对当前中文地址描述特点和地址匹配服务需求,本文从地址模型的智能化构建、地址编码和标准数据管理等方面,较为系统地探索标准地址数据库构建的关键技术问题,研发相应的原型系统。主要研究内容和结论如下:(1)自适应地址模型:在借鉴国家和行业分类标准基础上,对地址要素分类进行完善;采用地址要素描述词汇频率统计方法构建了地理要素特征词库;提出了基于关联规则和有限自动机的自适应地址模型构建方法,解决了地名描述要素和结构的规范化表达问题。(2)双重地址编码:针对地址具有描述名称多样性和空间位置唯一性的特点,以及“时间、空间、名称”的复合演变特性,提出了空间、属性“双重,,地址编码方案。空间编码表达空间唯一性特征,有利于实现地址数据的跨系统、跨行业共享;属性编码适应中文地址模型要素组成的多变性,有利于实现地址要素的高效查询检索。以常州地址数据为例,对地址编码质量进行定量和定性评价。(3)原型系统研发:根据地址要素层次关系和数据一致性约束,构建了标准地址数据模型;在分析地址生命周期和效用状态的基础上,以空间编码为纽带,实现了地址历史数据和现势数据的关联更新;采用地址要素组合查询模式,实现了地址数据的精确查询和模糊查询。在此基础上,研发了中文标准地址库原型系统,包括地址采集、地址查询、地址更新、地址匹配等功能。