基于实体密度的位置服务中kNN查询和连接方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:crosslightning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网与智能手机的高速发展,基于位置的服务(Location Based Service,简称LBS)逐渐成为一种基础服务。在基于位置的服务中,用户往往需要考虑实体在空间上的密集程度(密度)。如何在组织空间数据时标记实体的密度,以提高查询的有效性和服务的质量,是非常有价值的应用研究课题。另一方面,LBS业务高度依赖于迅猛增长的空间数据,同时用户在使用位置服务过程中又不断产生新的带有位置信息的空间数据,随着时间积累数据量将会越来越大。海量空间数据对高效组织方法和高效查询算法提出了极高的要求。本文的主要工作是面对海量空间数据,设计合理的算法同时满足空间查询的有效性和实时性两个要求。k最近邻(k-Nearest Neighbor,简称kNN)查询是LBS中的重要操作。已有空间数据管理kNN查询研究中,很少关心查询结果之间的位置关系,没有考虑实体密度因素,从而造成查询结果正确但是并不一定合理的情况。本文首先从空间数据的密度属性入手,通过R树建立过程中的节点分裂操作,加入密度属性值,基于R树和R*树的分裂方法提出了 DR树(Density R-tree)及其分裂方法,并设计了基于DR树的范围查询算法。利用DR树的密度属性值,减少了k N查询中的遍历次数和最后一次查询包含的实体数量,进一步优化了k N查询算法,提升了kNN查询的有效性和效率,达到海量空间数据查询的有效性要求。对于海量空间数据,传统集中式处理方法很难达到实时性的要求,于是要求对大数据集分块为小数据集,然后将每一个分块数据送入到分布式系统进行处理。其中,分块技术是分布式kNN连接查询中的第一步且重要的环节。已有分块方法存在分块之间地理位置不相关、分块大小不均匀、分块的额外开销太大、与现有系统不兼容等缺点。本文结合R树最小外接矩形特性和四叉树可固定树高,分块地理位置相关特性,提出一种新的分块方法——QR树分块算法,在一次扫描数据集的基础上达到了地理位置相关和均匀分块两个要求。在QR树分块算法基础之上提出了 QR树分块过滤算法,可以大幅度过滤掉不相关分块。在分布式kNN连接的第一次MapReduce阶段,通过合理的分块技术和过滤技术大幅度降低任务启动数量,最佳情况下降低到原来任务数量的约1/20。将海量数据进行分块处理,并且通过过滤技术将并行任务最大程度降低,最终达到了海量空间数据查询的实时性要求。最后基于Java EE平台实现了一个可演示空间查询系统,系统支持DR树范围查询、DR树kNN查询和QR树kNN连接操作。在南京市饭店和北京出租车两个真实数据集上通过实验验证了 DR树范围查询、DR树kNN查询和QR树分块过滤算法在有效性和效率方面的明显优势。
其他文献
CMT焊接工艺创新地将熔滴过渡与送丝运动结合,实现了低热输入、无飞溅的焊接,从而克服了传统熔化极气体保护焊飞溅大、变形大的问题,使得CMT应用于钢与铝焊接、薄板甚至超薄
目的探讨骨外固定支架固定胫腓骨骨折患者的临床效果与护理方法。方法对28例采用多功能外固定支架治疗的胫腓骨骨折患者进行随访分析。结果随访28例,随访时间6~12个月,28例胫
目的:分析仙方活命饮加减坐浴联合辨证施护对肛周脓肿患者术后视觉模拟评分法(VAS)评分及生活质量的影响。方法:选取2016年1月-2018年2月我院收治的82例行肛周脓肿术患者,随
目的研析冠心病采用不同剂量培哚普利进行治疗的效果情况。方法选取2017年4月~2019年1月到我院就诊的75例冠心病病人为对象,依据治疗方案的不同将这些病人纳入A、B、C三组,各
电子通讯事业和互联网的飞速发展,使得个人的信息被普遍地传播和利用。人们对信息的依赖性也越来越强,因此个人信息的地位则日益凸显。信息社会在给我们带来极大便利的同时,个人信息被泄露和滥用问题也随之而来,且越来越严重。个人信息已成为当下社会最重要的商品。因此,如何解决信息时代下个人信息的法律保护显得尤为重要。本文正是在这样的背景下,以最高院审理的开机提醒案为切入点,提出应当重视对“用户使用状态”这类个人
目的:追溯黄土汤的渊源、概述黄土汤的方证、研究黄土汤的现代临床应用及进展。方法:查阅秦汉至明清时期的医史、史籍中关于黄土汤的早期记载,考证黄土汤的来源及发展;检索近
培养应用型人才是我国高等教育进行大众化教育的主要目标和任务,而《数控技术》课程是机械类专业一门覆盖知识面广、专业技术性强、实践性强的专业课程。本文以北京交通大学
对工程测量学进行了定义,指出了该学科的地位及研究应用领域;阐述了工程测量学领域通用和专用仪器的发展。结合科研和开发实践,简介了地面控制与施工测量工程内外业数据处理
“势”在中国画绘画构图中具有重要地位,“势”能使一幅作品充满生命力,使人感到美,并让人神往,一幅绘画作品是否成功,“势”起了决定性的作用。本次选题是以具有顽强生命力的茅草为主要创作对象,虽然它很平凡,但是在疾风中却能依然保持旺盛的生命力,确实很令人敬佩。取材的另一用意,也是在暗喻自己,虽然平凡,但是面对挫折从不屈服,坚持不懈。本次创作是要通过对“势”的研究表现疾风知劲草那种坚韧不拔的品格,表达自己