基于频繁结构的大规模动态图子图查询方法研究

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:ZPHZPH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步和发展,图作为一种重要的数据结构已广泛应用于各种新兴领域,如社交网、蛋白质交互网、生物信息网、智能交通网等。近年来,互联网用户数量的飞速增长和网络技术的深度发展,导致图数据规模日益庞大且动态变化。如何对大规模动态图进行有效的管理成为当前图数据领域研究的热点问题。子图查询作为重要的图搜索技术,因为其可以更具针对性地为用户返回查询结果而被广泛研究。传统算法处理大规模图子图查询效率低下,现有子图查询方法多通过建立索引或进行图压缩来加快查询。频繁结构在数据图中频繁稳定存在,并隐藏大量有用信息,很多方法对其建立索引以加速查询。但其多受查询图类型限制,难以满足任意查询需求并适应于任意大图数据查询。此外,已有研究多忽略大图数据的快速更新,难以处理动态图查询。为此,本文利用索引查询优势,提出了一种基于频繁结构的大规模动态图子图查询方法(subgraph query based on frequent structure in large-scale dynamic graph,FS-DSQ)。本文的主要研究工作如下:(1)充分分析频繁结构特征,提出旋转对称频繁结构,线下挖掘数据图中的该结构及对应子图,并建立旋转对称频繁结构索引(RSFS索引)以方便查询。提出索引的增量式动态维护策略,充分考虑频繁I/O及网路通信开销等因素,利用定时更新取代实时更新,根据变化类型不同,提出点、边增加和点、边删除两种动态维护策略,只对变化的索引项进行更新,避免全局更新带来的巨大开销。(2)提出大规模动态图子图查询方法,包括查询图分解、基于RSFS索引的动态查询。首先,提出基于最大分解原则的查询图拆解算法,将查询图逐步拆解为RSFS索引中其最大子集结构的集合。然后,进行子图优化查询与连接。利用RSFS索引对各拆解结构进行优化查询,利用前置结构查询序列L及公共点等信息形成查询约束,约束后置结构查询,快速过滤掉不满足约束的子图结果,仅保留有效的可连接子图结果集。利用旋转对称结构特征优势,对中间结果进行快速连接,形成查询结果。最后,利用收集的图变化操作,动态修正查询结果,以获得最终查询结果。(3)基于真实数据集和模拟数据集进行实验验证,从索引创建时间、存储开销、子图查询时间、索引更新时间四个方面与多种算法进行对比,在空间和时间上证明了本文算法的有效性。
其他文献
随着压缩的应用愈加广泛,关于压缩的研究也愈加深入。一个正交分量的噪声低于零点水平的压缩态更是因其在基础理论和实际应用方面的重要意义引起了科研学者的极大兴趣,从而极大推动了对压缩的产生的研究。在量子光学领域,目前被认为产生压缩最有效的方式是光学参量过程(OPO),很多学者利用参量下转换已经在实验上实现了压缩光的产生,并且随着研究的深入,压缩度在不断提升。而近年来,光力学的研究进展迅速,引起了其他领域
鄂尔多斯风沙滩地区地处我国西北干旱半干旱区,是我国重要的新能源基地,常年降雨稀少,蒸发强烈,水资源匮乏,地下水是主要的供水来源。包气带是连接土壤和地下水迁移转化的关键区域,影响着地下水的蒸发及入渗过程,且水分与热量的传输存在一定滞后效应。蒸发作为半干旱地区最重要的排泄方式,是土壤水分传输和热量运移的主要驱动力之一,受外界条件和土壤介质等因素的影响,其内部动力学蒸发过程具有极高的复杂性和非线性,目前
铬离子(Ⅵ)因具有高毒性、难分离的特点,在水污染处理领域已引起人们的广泛关注。但常规的分离方法大多存在着效率低、成本高、选择性低或易造成二次污染等问题。因此,迫切需要寻找一种对铬离子(Ⅵ)具有高选择性的吸附分离材料。金属离子印迹技术作为分子印迹技术的一个重要分支,因其具有高效率、高选择性、成本低等优点,被广泛应用于铬离子(Ⅵ)的分离富集领域,但常规离子印迹聚合物在研磨、过筛等制备过程中易对印迹位点
我国是一个农业大国,农业发展问题是重中之重。农业机械化是农业现代化的重要物质基础。近年来,党和政府越来越重视三农工作,出台一系列强农惠农政策,大力推广农业机械购置补贴,农业机械化在提高农业生产和农村经济发展中扮演着越来越重要的角色。福清市位于福建省东部沿海,是首批50个国家现代农业示范区之一,现代农业发展取得了阶段性的成效。福清市充分利用国家先行先试政策,积极发展现代农业,农业机械化发展取得了长足
本学位论文主要研究数据导向的垮图像域转译相关问题。图像转译技术适用的图像域不仅限于可见光图像,多光谱图像,也包括深度图或者语义标签图。在本学位论文中,我们主要关注
为防止农作物遭受病虫的侵扰而减产,世界各国都不同程度的生产和使用农药,大量农药的使用对生态环境和人类健康造成了威胁,为此农药检测技术的研究是环境领域的研究热点之一
运用微分几何方法研究了同结构高维混沌系统间的完全同步问题。高维混沌系统的同步问题较为复杂,并且对于MIMO非线性系统,运用单纯的微分几何方法只能处理系统相对阶与系统维数相同的情形。本文中,基于微分几何部分反馈线性化与零动态问题结合的方法,使高维同结构混沌系统间的同步问题获得了一个解决方案。在第一章中,简单介绍了相关的微分几何基础理论,包括非线性系统的状态空间描述、非线性系统坐标变换、相对阶nr(2
量子纠错码在量子信息处理和量子计算中有着重要的作用.相比现有的经典纠错码技术,量子纠错码技术能大幅度提高信息传输的安全性,通道传输的容量以及效率.q元量子MDS码具有较好的纠错能力和实用性,是量子纠错码中最为重要的一类.因此,构造量子MDS码,具有重要的理论和应用意义.近年来,许多不同类型的量子MDS码被构造出来,但除了少数的一些,几乎所有的q元量子MDS码的最小距离都小于或等于q/2+1.本文在
公安机关作为执法机关具有双重属性身份,在现有的法律框架下,公安机关一方面有行政执法权力,另一方面法律又授予其刑事执法职能,公安机关在行政执法与刑事司法的衔接过程中包括实体衔接、程序衔接。从公安机关视角分析丁某等人制作销售假奖券案件争议点,从实体衔接和程序衔接两个角度分析司法实践出现的分歧点,实体衔接是指对行政违法行为是否涉嫌犯罪的判断,以及当涉嫌犯罪的行政违法行为既要追究行政责任又要追究刑事责任时
严重退化土壤固碳潜力巨大。生态修复措施的实施,我国南方红壤侵蚀退化地植被逐渐恢复,林下发育了大面积的芒萁群落,并快速增加了土壤碳吸存,研究芒萁覆盖下新形成的有机碳稳