基于事务数据表的关联规则挖掘技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lilinchang0105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘的一个非常重要的研究分支,难点在于其挖掘对象是海量数据。Apriori算法需要对数据库进行多次扫描,在真正的海量数据库挖掘中难以实用; FP-Growth算法相对于Apriori算法在效率上提高了一个数量级,但内存消耗大,在海量级数据库实现上也存在困难。当前国内外研究关联规则的文献很多,大多数集中在对上述两个算法的改进上。本文研究如何由已知的事务数据库求出其相应的频繁项集和如何对由最大频繁项集生成的关联规则进行有效性检验。本文针对频繁项集挖掘分类提出了基于TD处理事务数据表的频繁项集挖掘算法,分别用于产生完全频繁项集、频繁闭项集和最大频繁项集。算法在整个挖掘过程中,只需要扫描一次事务数据库。在由最大频繁项集生成关联规则的时候,可能会产生大量的冗余规则,这使得用户分析和利用这些规则变得十分困难。本文对已有的多种关联规则删剪技术进行了研究,发现了它们存在的问题,提出把约束性作为一种新的删剪技术。将基于TD处理事务数据表的频繁项集挖掘算法应用于Mushroom数据库的频繁项集挖掘中,并通过算法分析说明本文提出的基于TD处理事务数据表的频繁项集挖掘算法在算法执行时间和空间的消耗上要优于FP-Growth算法。
其他文献
本课题从实际工程出发,对数字法庭音响扩声系统进行了设计,对数字房间校正技术提出了一种有效的策略,即将改进的自适应均衡技术应用于本系统,在整个扩声系统性能得到一定程度改善
移动机器人技术当今社会生活各方面得到广泛的应用。移动机器人的路径规划问题是移动机器人研究的重要组成部分。本文针对移动机器人的路径规划问题提出了一种实用的路径规划
本课题是国家科技支撑计划重点项目“虚拟实验教学环境关键技术研究与应用”(No.2008BAH29800)的延伸子课题,旨在建立一个完整的虚实结合网络实验平台。目前,整个实验平台可
随着机器人技术的发展和市场需求的推动,智能机器人越来越成为人们的研究热点。移动机器人是机器人研究中的一个重要分支,被广泛应用于物流、探测、军事、服务等领域。随着数