论文部分内容阅读
关联规则挖掘是数据挖掘的重要研究课题。大数据处理对关联规则挖掘算法效率提出了更高要求,而关联规则挖掘最耗时的步骤是频繁模式挖掘。针对当前频繁模式挖掘算法效率不高的问题,结合Apriori和FPgrowth算法,提出一种基于事务映射区间求交的频繁模式挖掘算法(interval interaction and transaction mapping,IITM)。只需扫描数据集两次来生成FP树,然后扫描FP树将每个项的ID映射到区间中,通过区间求交来进行模式增长。该算法解决了Apriori算法需要多次扫描