基于FP-tree的多层关联规则挖掘算法的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:westy116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多层关联规则挖掘是关联规则领域里的一个重要研究方向,而作为多层关联规则挖掘中最耗时的部分——频繁模式挖掘,其算法的好坏直接影响到关联规则挖掘的效率。因此,设计高性能的频繁模式挖掘算法具有重要意义。本文在对FP-tree结构深入分析的基础上,提出了两种频繁模式挖掘算法。针对FP-growth算法时间效率不高的不足,提出了一种新的基于FP-tree的频繁模式挖掘算法FPIFS算法。该算法在FP-tree中的每一个节点域中增加了一个前缀路径域,用于存放该节点的所有前驱。当遍历FP-tree的时候,只需扫描几个节点,就可以求出大部分节点的前驱。当处理这些节点的父节点的时候,就不需要重复扫描这些路径,避免了在挖掘过程中对同一路径进行多次回溯,从而提高了时间效率。针对现在的大多数多层关联规则挖掘算法只能挖掘同层次的关联规则,提出了一种基于FP-tree的多层关联规则挖掘算法FP-ML算法,该算法首先找出那些在当前层不频繁,而其父项却是频繁的项,采用一种替换策略,将其用父项来取代,然后再调用FPIFS算法对新的交易记录进行挖掘,最终挖掘出不同概念层的频繁模式。将FPIFS算法与FP-ML算法分别跟FP-growth算法和MLAR-FP算法在T10I4D100K数据集与真实数据集——retail数据集上进行实验比较分析,结果表明FPIFS算法的时间效率优于FP-growth算法,其稳定性较FP-growth算法要好;FP-ML算法的时间效率优于MLAR-FP算法,其稳定性较MLAR-FP算法要好。
其他文献
局部网络编码作为实用网络编码的一种策略,可观的网络性能增益以及在无线网络中的实用性使其成为当前的研究热点。本文概述了实用网络编码的研究现状,总结了实用网络编码中典
XML技术作为信息交换的有力工具,近年来在数据库和网络服务等领域得到广泛应用。XML解析是XML技术中的关键任务,关系着XML应用的性能。已有的市场化XML解析器通常都是软件实
在联网控制技术飞速发展的今天,自动化技术广泛用于工业、农业、军事、科学研究等方面。M2M也就是机器与机器(MachinetoMachine)的对话,是将数据从一台终端传送到另一台终端
随着互联网技术和多媒体技术的迅猛发展,网络技术和教育技术日益融合,由此构成了一种新兴的教育方式—远程教育。远程教育已成为现代教育技术的重要手段,这种教育方式也越来越被
学位
随着信息产业和通信技术的发展,企业在信息化建设过程中构建起多个异构的信息系统。为了解决网络环境中异构数据库的数据集成和共享问题,更有效地利用这些资源,需要在一个统
本文讨论了二维平面下曲线的可见性问题。我们研究的两个主要内容是:曲线的弱可见多边形算法,沿曲线移动的点的实时可见多边形算法。曲线与直线不同,可能具有复杂的形状与性质
在高校教育环节中,实践教学是提高学生实践能力、培养学生综合能力的主要方法,直接影响着教学质量的好坏。传统的实践教学管理效率低、时效性差、重复性工作多,不能满足管理
词性标注是自然语言处理中一个具有重要意义的研究方向,涉及的应用领域非常广泛,在信息处理范畴内起着重要的基础性作用,词性标注的效果直接影响着基于标注结果的各种信息处
传统的电器,传统的家用设备都已经显得过期了。所以如果有一种办法使得以前的老电器不换的情况下通过智能手机实现维吾尔语语音控制控制是具备研究意义与实践意义的一个课题