基于MFP-tree的关联规则挖掘算法研究

来源 :全国第19届计算机技术与应用学术会议(CACIS·2008) | 被引量 : 0次 | 上传用户:fangfei330654395
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。关联规则挖掘是数据挖掘的一个重要研究分支,主要用于发现数据集中项之间的相关联系。信息技术的快速发展使得众多行业和部门的数据量激增,而这些数据大多都是关系型数据库,积极研究在关系数据库中挖掘关联规则的有效技术具有极为广阔的发展前景。基于FP-tree的关联规则挖掘算法FP-Growth是当前挖掘频繁项目集算法中应用最广,并且不需要候选集的一种挖掘关联规则的算法。但是,FP-Growth算法在挖掘大型关系数据库时占用内存大和运行速度慢甚至根本无法构造基于内存的FP-tree。针对这些不足,本文提出了一种新的关联规则挖掘算法,即DMFP算法,以解决大型数据库挖掘的需要。本文所做的研究工作如下:(1)对数据挖掘和关联规则挖掘技术发展现状进行了探讨。(2)对关联规则挖掘理论展开研究,讨论了一些传统的关联规则挖掘算法及存在的问题。(3)在对FP-Growth算法深入研究的基础上,提出一种改进的适合大型数据库挖掘的关联规则挖掘算法DMFP算法,并进行了实验验证和性能分析。该算法减少了FP-tree所占用的内存,实验表明该算法比FP-Growth算法具有更好的性能。(4)结合实际,将DMFP算法应用于一个个人情况调查表中,结果表明该算法是可行性的。
其他文献