快速频繁项集挖掘算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:gdutzxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FP-growth算法是当前挖掘频繁项目集算法中应用最广,并且不需要候选集的一种挖掘关联规则的算法。但是,FP-growth算法在挖掘大型数据库时占用内存大和运行速度慢。为了克服这些不足,本文基于FP-growth算法提出了两种新的适合于挖掘大型数据库的关联规则算法,即EFP-growth和LFP-grwoth。EFP-growth算法利用项集等价类将关联规则挖掘的项集分成互不相交的子空间的性质,将一个大型数据库分解成多个投影数据库,依次在每一个投影数据库上进行约束频繁项集挖掘。算法尤其适合支持度较小时的大型数据库的挖掘。分析和实验表明EFP-growth算法在挖掘大型数据库时时间和空间的性能上均优于FP-growth算法。而且,随着数据库规模的增大,EFP-growth算法具有更明显的优势。LFP-grwoth算法将原来的搜索空间(格)划分成若干个更小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子网格的并集进行的约束频繁项集的挖掘。实验结果和理论分析表明,LFP-growth算法在挖掘大型数据库时时间和空间的性能上均优于FP-growth算法。而且,随着数据库规模的增大或支持度阈值的减少,LFP-growth算法具有更明显的优势。本文还介绍了EFP-growth算法和LFP-grwoth算法挖掘频繁项集的一个应用实例。
其他文献
学位
摘 要: 新时期的中学生既有思想,又有主见,既幼稚,又成熟,思维活跃,希望在快乐宽松的环境下生活、学习。微笑能使学生感受到教师的理解、关心、宽容和激励,使学生在愉快和谐的氛围中探求新知。  关键词: 微笑 融洽 问卷调查  2004年9月1号的一堂英语课,历历在目,那是我教师生涯中的第一堂英语课。我怀着无比激动的心情踏上神圣的三尺讲台,然而接下来的一切让我既无奈又无助:课堂气氛异常活跃,讨论声很嘈
摘 要: 小组合作学习是当前较流行的一种教学模式。这种教学方式有利于发挥学生的学习合力,极大地调动学生的学习积极性,使学生在合作、竞争中不断提高自身能力,并在学习中相互帮助,相互促进,共同提高。如何充分发挥合作的力量,怎样采用有效的合作方式及建构合理的合作体系及采用怎样的评价方式是教师急需解决的课题。  关键词: 英语教学 合作意识 合作动机 合作时机 小组合作  当今的社会是信息社会,是一个崇尚
绿色荧光蛋白(GFP)基因作为标记基因,被广泛应用于环境微生物学方面,由于其表达稳定,容易观测,因此,也可以作为启动子活性的报告基因.为了进一步优化短小芽孢杆菌表达系统,以
本文通过对荣华二采区10
期刊