图数据库中的子图查询算法研

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qlj403740087
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是计算机科学中的重要数据结构。随着信息技术地不断发展,出现了越来越多的以图作为逻辑表达的数据,例如化学分子结构式,生物网络,社会网络以及图像中的实体关系等等。另一方面,这些图数据本身的数据量也在不断增大,例如每天就有4,000个新的化学结构被加入到SCF Finder数据库;现在的社会网络图中的结点数目超过了1 亿5 千万。如何有效地管理和挖掘海量的图数据是图数据库研究的核心问题。具体包括:1如何建立有效的存储机制和索引策略;2如何有效地回答图数据库中的查询;3如何从海量的图数据库中挖掘出有用的信息。   子图查询是图数据管理中的基本操作。具体地说,给定一个查询图Q 在图数据库中找到所有包含查询图Q的数据图。由于子图同构是典型的NP 完全问题,目前的子图查询算法均采用“过滤-精化”的算法来找到结果集。在过滤阶段,根据某种子图同构的必要条件过滤掉不可能包含查询图Q的数据图;然后在精化阶段利用子图同构算法在剩下的数据图中找到结果集。目前的大部分的过滤策略都是基于“特征子结构”獴敲汩湧简称“特征”捵牲敮捹的方法。这种方法没有考虑到特征之间的拓扑关系。根据特征和特征之间的拓扑关系,设计一种新的过滤策略将加快子图查询的响应时间。另外目前的子图查询算法没有考虑数据库频繁动态更新的情况。   当数据库出现增删改时,不得不重新建立索引。为了适应动态的图数据库,根据图谱理论,将图的拓扑信息映射到数据空间中;并根据映射的数值空间,建立相应的索引结构。这种方法不但加快了过滤的时间,且可以动态的维护索引结构。   随着社会网络等复杂网络的出现,给定查询图Q 如何在一张大图中找到Q的匹配位置是非常有意义的课题,例如可以帮助我们找到社会网络中的特定的朋友圈,以及生物网络中的功能团。大图上的匹配的定义本身并一定是基于子图同构。因为网络上考虑的更多的是两点之间的连接性关系。根据连接性关系,找到查询图Q的所有匹配位置。因为通常复杂网络中的节点数目是海量的,为了减少搜索空间,将图结构中映射到向量空间。通过在向量空间的操作,找到所有的候选匹配位置;然后在原来的图结构中确定最终的匹配结果集。   图数据挖掘可以帮助我们从海量的图数据中找到有用的知识,其中频繁结构模式挖掘和结构相关性挖掘是两个重要的课题。目前的结构模式挖掘算法大部分采用“生成-检测”的算法框架。这种方法的缺点是“检测”阶段耗费大量时间。根据图数据的特例“树数据”的特点,采用模式增长的方式设计频繁结构模式挖掘算法,从避免了检测阶段。给定一个查询图Q 希望从图数据库中找到与Q有高度相关性的子结构。这个问题的难点在于海量的搜索空间。为了加快算法响应时间,根据模式增长的策略,设计一种有效的过滤策略。   用图结构来表示关系型数据库中的记录之间的“控制”关系,从将传统的Top-K 查询问题转换为图结构中的遍历问题。与现有的经典Top-K查询算法相比,这种方法的优点是其搜索空间较小。
其他文献
随着网格技术的发展,人们越来越关注网格系统的安全。网格计算中协作计算的网格节点,可能是相互信任的合作者,也可能是不能完全信任的合作者,甚至是相互竞争的对手。现有网格
互联网的广泛应用正影响和改变人们的生活方式,而且其应用领域也越来越广,但是其安全问题也十分突出,在电子交易、网络购物、匿名投票等应用领域中用户的隐私保护十分重要,参
计费系统对于运营商来说是一个极其重要的支撑系统,不仅可以用于统计用户的费用,而且还可以用来监控网络数据流量,优化网络资源分配。随着多媒体业务的层出不穷,对网络服务质量提
社交网络的发展给推荐技术带来了新的契机,利用社交关系进行社会化的推荐,不仅能提高推荐的准确率,更能让用户信任系统的推荐理由,因而得到了电子商务网站和许多科研人员的青
近年来,由于数据信息量的激增,数据挖掘面临高计算量的挑战,计算问题成了数据挖掘进一步发展的主要瓶颈。网格作为一门整合资源的技术,它的出现为数据挖掘中计算能力不足的缺
真实感三维人脸合成技术在计算机视觉和图形学领域一直是备受关注的研究热点,研究成果丰富。主要成果集中于人脸建模和动画合成,以及人脸合成中的几个分支,如人脸表情、姿态、光
学位
科学、规范的教学管理是获得高水平教学质量的必要条件,课表安排则是教学管理中最为关键的一环。制定一个灵活、高效、人性化的课程表,将对后继教学活动的有序开展起到至关重要
家庭服务机器人与人之间除了通过语音交互以外,还需要像人类一样通过“肢体语言”进行辅助交流。因此,机器人如何识别人的姿势,就显得非常必要。而人体姿态千变万化,形态各异
随着嵌入式应用领域的不断发展,对嵌入式操作系统的资源开销、实时性和灵活性等方面提出了更高的要求,因此,可以通过对嵌入式系统集成开发环境的扩展,使其能对操作系统进行配
Ad Hoc网络是一种特殊的对等式自组网络。它利用无线通信技术,通过相邻节点的转发来实现通信。它是一组带有无线收发装置的移动终端组成的多跳性移动网络。它具有网络自组性、