【摘 要】
:
随着移动终端,如手机,平板电脑等的普及,和位置传感器、定位及导航系统的广泛应用,产生了大量带有地理位置信息的空间数据,也催生了大量对基于位置的服务的需求。比如,百度地图中的导航功能,大众点评中离我最近的餐厅功能等都给用户带来了便捷。针对如何利用空间查询技术对海量空间数据进行存储和分析,并最终支持用户日益个性化、多样化的查询需求,如何进行高效的空间关键词查询(Spatial Keyword Quer
论文部分内容阅读
随着移动终端,如手机,平板电脑等的普及,和位置传感器、定位及导航系统的广泛应用,产生了大量带有地理位置信息的空间数据,也催生了大量对基于位置的服务的需求。比如,百度地图中的导航功能,大众点评中离我最近的餐厅功能等都给用户带来了便捷。针对如何利用空间查询技术对海量空间数据进行存储和分析,并最终支持用户日益个性化、多样化的查询需求,如何进行高效的空间关键词查询(Spatial Keyword Query)显得至关重要。常见的空间关键词查询分为范围查询和最近邻查询,尽管这两类查询已经带来了大量便利,但这两类查询仍然存在一个问题:无法精确捕捉用户意图。比如,现有的空间关键词查询算法不能处理对于不同对象之间的关系有限制的需求,也不能处理多个查询对象且任意两个对象间距离区间都不同的需求。针对此问题,本文围绕空间模式匹配(Spatial Pattern Matching)展开研究。本文的主要研究工作有:(1)改进了现有的空间查询模型,使用基于图的空间模式对查询条件进行建模。空间模式是简单图,图的每个顶点对应了一个对象,图的每条边对应了顶点间距离区间和相互关系。对于同一个模式,本文使用现有的空间查询mCK算法和本文设计的适用于SPM的算法找出匹配,对比这两个匹配,可以看出,空间模式能够更加精准地捕捉和满足用户需求。(2)改进了适用于图模式匹配问题的算法来进行空间模式匹配,同时,基于多路连接的思想设计了 MSJ算法,MSJ通过动态规划简化模式中的距离关系,并采用剪枝策略进一步优化,实验表明MSJ算法更高效。(3)针对当用户给定的空间模式要求较宽松时,找到的匹配过多对用户进行选择造成了负担的情况,设计了评估函数用于评价不同匹配的质量,并提出了快速排序算法IncMatch能够在不求出全部匹配的情况下增量搜索并返回最佳的匹配。(4)针对用户给定的空间模式限制过多,导致模式无法在空间数据库中找到匹配的情况,引入最大可行子模式的概念来衡量匹配程度,并分别基于Aporiori思想和MARGIN思想设计了两种算法APM和MPM来找出最大可行子模式,进而找到对应于最大可行子模式的部分匹配。
其他文献
在我国进行能源结构大调整的过程中,核电在满足国家能源供应安全、实施能源供给侧结构性改革中发挥了重要作用。随着工业信息化时代的到来和核电装机容量的不断增加,如何将快
目前,我国经济发展步入“新常态”,经济增长速度趋缓,创新驱动发展战略成为我国走出“结构性减速”的经济发展困境的关键举措。而无形资本作为创新的重要载体和体现,无疑对经
桑条平茬收获类机械近些年在我国有很大的发展,但大都只能适应某一特定地区的收获条件。我国桑园地块分散,种植的地形复杂,有平地、山地、坡地等,机械适应性不强。栽植模式没
[背景]慢性阻塞性肺疾病(COPD)是一种常见的慢性的气道炎症性疾病,以持续气流受限为特征,目前已成为全球第四大导致死亡的疾病。一直以来,一秒用力呼气容积(FEV1)和年龄被认
随着金融一体化的加深,国际消费风险分担水平不断提升,与此同时,各国的资产负债表不断扩张,估值效应的规模与波动不断增加。金融危机后,发达国家的估值效应与国际消费风险分
锂硫电池(Li-S)因其高理论容量、活性材料硫来源丰富等优点,受到许多研究学者的青睐。然而,正极材料所面临的一系列问题包括导电性差、长链多硫化物易溶出、体积变化大等严重
女性生理周期的变化规律与卵巢周期活动息息相关,在排卵前后常伴随着人体体温的变化。通过测定基础体温得到基础体温曲线,进而观察其中的变化可以判断女性有无排卵、推测排卵日期、分析黄体功能等。因而测定女性的基础体温曲线可以辅助医生诊断与治疗某些妇科疾病。然而,由于人体动静态的特性,体温数据的获取以及进一步的分析会受到一定的影响。因此,如何绘制出一条能准确反映女性生理周期变化的曲线显得尤为重要。本文通过采集
目的:异基因造血干细胞移植是治愈多数血液系统疾病的唯一手段,急性移植物抗宿主病是导致患者死亡的最主要原因,由于aGVHD的治疗困难,早期预测或诊断急性移植物抗宿主病对改
在大田试验条件下,采用裂区设计,在浏阳与衡阳以杂交稻株两优819和常规稻中嘉早17为早稻材料,以杂交稻泰优390和常规稻湘晚籼13为晚稻材料,设置无氮常密(0 kg N/hm~2,28.57万
在人工文本键入过程中,人们通常会根据语言习惯自发的在文本中添加标点。但是在一些自动文本录入过程中,例如语音识别过程,得到的文本是没有断句和标点标注的(无标点文本)。这种文本使得读者无法找到一句话的起点和终点,不能从文本中划分出明确的阅读单元,从而带来比较严重的歧义问题。同时,无标点文本还会给下游的自然语言处理任务造成困难。处理这些任务的模型常使用有标点文本进行监督训练,利用这些模型直接对无标点文本