有向图上k步可达查询处理研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:njg916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k步可达查询处理在现实世界中有着广泛的应用,例如好友推荐、交通线路查询、网络路由等。k步可达查询用于回答两个顶点之间是否存在一条长度不超过k的路径。相较于传统的可达性查询,k步可达查询可以提供更多的信息。然而,现有的k步可达查询算法大多只能应用在有向无环图上。能应用于带环有向图的k步可达查询算法又存在索引规模大,索引构建时间长以及查询效率低等诸多问题。本文研究带环有向图上的k步可达查询处理问题,研究内容如下。首先,提出了一种基于贪心思想的近似最小顶点覆盖集求解算法。该算法每次选择当前度最大的顶点加入覆盖集,从而降低覆盖集的规模。通过使用哈希计数方法,可在线性时间得到近似的最小顶点覆盖集。提出了一种基于最小顶点覆盖集的2-hop索引,该方法结合了最小顶点覆盖集和2-hop索引的优势,通过建立仅包含覆盖点的2-hop索引,降低了索引构建时间,索引规模以及查询处理时间。其次,提出了三种优化策略来进一步加快查询处理的速度。第一种是基于互逆拓扑序号的不可达查询优化,提升了不可达查询的处理效率。第二种是基于带环有向图的等价压缩策略,进一步减小了图的规模。第三种是基于阈值的索引优化策略,改善了非覆盖点查询效率低的问题。最后,在25个真实数据集上对提出的最小覆盖集求解算法与已有算法进行了比较。实验结果表明,本文提出的算法求解出的覆盖集规模更小,同时基于覆盖点构建索引的方法在索引构建时间,索引大小以及查询时间三个指标上的性能都优于已有的算法,并且在给定16GB内存的前提下,能支持在千万级顶点规模的带环有向图上高效处理k步可达查询。
其他文献
航天结构件需满足极端服役环境,对产品质量与性能要求极高。其加工过程涉及信息复杂,对加工结果影响巨大。传统的加工过程信息传递模式,存在信息来源离散、表达方式落后等问题,难以保证加工效率和产品性能。数字孪生可以实现工件虚实映射,达到加工过程信息集成的目的。而增强现实技术是一种高效的人机交互技术,能够将虚拟信息融合到物理世界中。本文研究了一种基于增强现实的航天结构件数字孪生加工过程信息虚实融合与交互技术
知识图谱是人工智能应用重要基础资源,以人工智能与制造业结合的智能制造领域也逐渐成为新一代产业革命的核心发展方向。高价值的复杂产品因其复杂性,导致装配困难易错,装配指南便成为了非常重要的辅助工具,利用知识图谱这种图结构的数据格式来储存装配信息数据,更便于这类复杂知识在计算机系统中的存储与检索,以实现装配的快速问答与时效性强的指导,将装配环节也推进到智能制造。本文基于知识图谱技术工具,结合交互设计方法
推荐系统是目前用来缓解信息过载的常用技术。个性化推荐系统依赖于用户的行为反馈数据,包括显式反馈和隐式反馈。诸如点击和收藏之类的隐式反馈由于其收集成本低廉,数据量大并且含有更加丰富的隐藏信息而被广泛研究并应用于推荐系统中,其应用的难点在于对用户行为的解释,隐式反馈的解释高度依赖于各应用领域。本文将电商领域基于多行为隐式反馈的在线推荐问题形式化为多臂赌博机问题,提出了一种基于多臂赌博机的在线推荐模型。
近年来,自动驾驶成为人工智能领域的一个热点问题。设计出性能优越的车辆检测与跟踪算法模型,并将其应用到自动驾驶系统、交通监控系统以及智能停车场系统等多个领域,这成为计算机视觉的主要研究方向。本文在深度学习的基础上,研究车辆检测与跟踪算法,利用深层网络提取车辆特征,不仅达到实时性检测的要求,也实现了较高的准确率。主要创新包括以下几个方面:针对车辆检测问题,本文采用现阶段流行的快速实时的实例分割模型YO
随着医院信息化建设的不断完善,电子病历系统的使用也越来越普遍,由此积累了大量的医疗数据资源。出院小结现病史是这些医疗数据资源的重要组成部分之一,记录了住院患者的健康状况以及诊疗过程,蕴含着丰富的医学知识。然而,出院小结现病史是一种非结构化的叙述性医疗文本,很难直接应用机器学习或深度学习模型进行数据挖掘与分析,在一定程度上阻碍了医疗数据的再次利用。因此,对出院小结现病史进行结构化处理,有助于发掘数据
基于多视角图像的三维重建技术是计算机视觉领域的一个重要的研究方向,该技术在文物保护、场景模拟、医学治疗、人体测量等领域中有着重要的应用价值。随着数字图像处理与三维重建技术的快速发展,人们对三维模型的完整度和细节化的要求越来越高。针对这个实际应用问题,本文针对人体三维重建的相关技术展开了研究,本文主要工作包括:(1)首先本文利用智能手机获取多视角人物图像序列,由于本文的研究目标是对人体进行三维重建,
椭圆是自然界最常见的几何形状之一,现实中的许多物体都具有椭圆的几何特征。在计算机视觉领域,椭圆检测一直是一项基础、重要的任务。在实际应用中,目前的椭圆检测算法还面临着许多问题,例如漏检小椭圆、复杂背景下的目标检测结果中会出现重复椭圆、检测速度不够快难以在线应用等。针对这些问题,本文提出了基于弧段提取的椭圆检测算法,该算法用双阈值从图像边缘中提取出椭圆弧段,将不同类别的三段弧组成三元组,三元组受到弧
回归缺陷指在程序的开发过程中,由于开发或维护人员错误的修改导致正常的工作的程序功能无法正常运行。研究人员们提出了多种回归缺陷定位技术,但很少有研究工作用于定位多线程环境下的并发回归缺陷。并发回归缺陷研究的一个主要的挑战是社区缺乏用于实验的并发回归数据集。为了促进并发回归缺陷领域的研究,并提供一个有效的研究评价基准,本文主要完成了以下工作:(1)基准项目调研。调研了并发和回归缺陷领域的优秀成果,统计
随着移动互联网的快速发展,在线社交成为人与人之间交流的一种重要方式。尤其是在最近的几年,凭借着庞大的用户群体,微博、Twitter、Facebook等社交网络平台获得了巨大的商业价值,但是为平台作出贡献的活跃用户及优质内容的发布者却未得到应有的收益。此外,在传统的网络社交平台中,用户在平台上产生的数据都由中心服务器进行存储,平台可以获取用户的所有信息,这种中心化的数据存储方式,存在着用户信息泄露和
可达性查询处理是图数据管理与分析的基本操作之一,一直以来都是研究者广泛关注的热点问题。现有方法通常使用树区间或者基于部分结点的2hop标签来加速查询处理的速度。实际应用中,这种加速查询处理的方法存在两方面的问题。一是在给定特定数据图的前提下,没有人研究应该使用哪种索引比较合适;二是即使使用了树区间或者基于部分结点的2hop标签,也没有人研究应该使用多少个区间或者使用多少个结点来构建2hop标签才合