频繁子图挖掘算法的研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:liongliong437
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘的对象包括像关系数据库中的结构化数据,也包括诸如文本、图像、图形的半结构化数据或非结构化数据。同结构化数据相比,非结构化数据能更好地表达对象间的联系。随着非结构化频繁模式挖掘的发展,子图挖掘成为新的研究热点。图是一种复杂的数据结构,这使得挖掘图中令人感兴趣的子结构以及频繁模式变得比挖掘一般数据要更加困难,需要综合运用图的相关知识和数据挖掘的技术。目前子图挖掘领域中主要存在的问题是:生成的候选子图数量庞大,需要花费大量时间判断子图匹配以及重复扫描数据集来计算支持度,影响算法性能。本文重点研究如何缩减频繁子图的候选集,提高算法效率。主要工作如下:1.本文结合图论知识,对AGM (Apriori-based Graph Mining)算法进行了改进。改进方法针对子图同构以及冗余子图的问题,将图的顶点和边追加标识,并按标识大小进行排序,在参与候选图生成前先确定图的邻接矩阵,这样能在一定程度上减少冗余子图生成数量,减少了计算时间开销,提高挖掘效率。同时改进算法能够更有效、便捷地判断矩阵间是否存在等价子矩阵。2.针对连通图特定模式,本文提出了一种连通图频繁模式挖掘的改进方法。结合图论知识,深入分析了节点邻接矩阵,提出了图的连通性判定准则。同时从数学定义上严格描述了路径和节点邻接矩阵的概念,并运用于改进方法。该方法基于AGM算法,在图的邻接矩阵结合时加入一些限制条件,使之满足一些特性。改进方法有效地减少了候选子图的生成数量,缩减了计算时间。
其他文献
序列密码是对称密码学的一个重要分支,被广泛应用在对安全性要求比较高的场合比如军事、通讯。与分组密码相比,序列密码具有硬件实现简单、加解密速度快以及错误传播少等优势
目标跟踪最初是为适应现代军事发展的需要而被提出的,经过众多国内外学者的研究,已经发展成为一个具有普遍实用性的领域。在空中侦察与预警、弹道导弹防御、战场监视等军事领
在各种多媒体服务和数字通信等应用领域,图像编码是至关重要的技术之一。上世纪90年代,分形图像编码作为一种全新压缩编码方法开始兴起,它的整体理论是建立在图像自相似基础
无线传感器网络(Wireless Sensor Networks,简称WSNs)是由分布在目标区域内大量传感器节点自组织形成的一类网络,广泛应用于各种特殊的监测任务。这些应用都是由传感器节点收
集群式供应链是一种新型的企业协作模式,通过企业服务间的动态匹配和组合来应对动态多变的市场需求,且不必因维持过高的产能而导致其自身的成本增加。然而,服务资源的非均等化现
远程教学是目前教学改革的重要内容,而虚拟实验室填补了远程教学中教学实践方面的空白,对提高远程教学的质量具有重要的意义。但是,当前的虚拟实验平台普遍不能支持异构资源
聚类技术作为数据挖掘领域的一个重要研究方向,可以有效地帮助人们了解数据的分布和特征,以便作进一步研究分析。虽然已有的聚类算法很多,但聚类技术依然存在很多问题和挑战
学位
视频处理技术是伴随着视频从模拟到数字化转变的过程中得到蓬勃发展的。随着人们对视频图像的清晰度、流畅度、实时度的要求越来越苛刻,使其成为了一项炙手可热的技术。1980
运动人体检测是视觉人体运动分析中的关键技术,是进行各种后续处理如运动人体识别、运动人体跟踪的前提和基础,在高级人机交互、视频会议、智能视频监控等方面具有广泛的应用