基于网络文本的地名空间模糊建模

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:nhekccxeadk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地名作为最常用的社会公共信息之一,是国家行政管理、经济建设、国内外交往不可或缺的基础信息资源,在移动位置服务、网络电子地图、智能交通、公共安全等领域中都有着广泛的应用。目前我国已经构建了全国级、省级和市县级不同规模、不同尺度的地名数据库,但是由于我国地名数量众多、地名更新速度快,地名数据库中信息不完备,特别是空间位置信息缺失问题普遍存在。随着Web2.0等互联网技术体系的出现,网络已成为除GPS、遥感影像等之外的一种新型的地理信息来源。从海量网络资源中挖掘地理信息成为地理信息科学研究的重要内容。  本文利用CRF模型和规则模型实现了网页文本中空间信息的获取,在实现地名的空间语义消歧的基础上,探讨了基于密度分析的模糊建模方法和空间关系语义解析模型的模糊建模方法,主要研究内容和成果如下:  (1)基于信息抽取技术的地名空间位置信息获取:以网络文本为数据源,在地名识别和空间关系抽取的基础上,采用网络爬虫技术和主题敏感性网页获取技术,借鉴自然语言处理和地理信息抽取技术,对网页文本中的地名实体、地名坐标信息、空间关系信息的抽取,为进一步的地名消歧和地名空间模糊建模提供数据基础。  (2)基于地名行政隶属树状图的地名空间语义消歧:地名数据库中的地名之间具有行政等级的隶属关系的特点,在网页文本中地名识别的基础上,基于地名数据库匹配,构建与歧义地名关联的行政隶属树状图,根据树结构的健壮性判断歧义地名的空间位置,实验表明,在地名敏感性较强的网页中,该方法具有一定的可行性。  (3)基于相关性地名密度分析的地名空间模糊建模:假设文本中的地名之间具有一定相关性,提出了基于相关性地名密度分析的模糊建模方法。其核心思想是从文本中抽取空间相关性的地名,通过对其进行密度分析,和设置密度阈值来实现密度点的筛选,基于筛选后的点构建出地名的模糊区域。实验发现,该方法与基于上下文空间关系地名空间模糊建模的方法具有较好的互补性,进一步的提高地名空间模糊建模的精确性和可靠性。
其他文献
二十世纪以来,由于人口数量的急剧增长,造成人类对土地的需求压力越来越大,与此同时出现了很多土地的不合理利用现象,导致全球性的生态环境问题逐渐凸显出来,例如温室效应、
石家庄市作为河北省的省会,自2012年以来就深受雾霾天气的困扰,特别是秋冬季节重污染天气现象的频繁出现,严重影响到了当地人民的正常出行、健康和生活,大气污染问题广受关注。为进一步考察石家庄的大气污染现状,本文以石家庄市作为研究区域,选取2015年作为此次研究的基准年,搜集各类污染源的活动水平数据,采用排放因子法和经验公式法,建立了石家庄市2015年大气污染源排放清单。主要研究内容及方法包括:(1)
学位
人口与经济、社会、资源、环境等要素的不相协调是目前制约我国区域发展的关键问题之一。这些问题在我国山区、贫困区和生态屏障区显得尤为突出。通过综合评价区域人口发展的
本文利用VB、Excel、DPS数据处理系统等软件对乌鲁木齐市气象观测站1951~2008年共57年的的逐日气候资料进行了数据分析处理,并通过线性趋势分析、突变点分析、相关性分析、R/S
分析尺度因其与DEM数据分析、解释与应用等内容相关联而在数字地形分析的尺度体系中具有重要地位。如何采用多尺度分析方法刻画地形具有自相似、多层次、多尺度等基本特征,并