【摘 要】
:
关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完
论文部分内容阅读
关联规则是数据挖掘领域中的一个非常重要的研究课题,广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的规律。有效地发现、理解、运用关联规则是完成数据挖掘任务的重要手段,因此对关联规则的研究具有重要的理论价值和现实意义。本文深入分析了FP-Growth算法的不足,从数据结构与挖掘方法两个方面进行改进,提出了基于改进FP树的频繁模式挖掘算法。该算法减少了FP树所占用的内存,节省了条件模式树生成所耗的时间。实验表明改进后算法比FP-Growth算法具有更好的性能。然后,在数据库记录增加的情况下,提出了一种高效的最大频繁项目集的增量更新问题。该算法对新增事务处理时,不再向原来FP树子树上增加结点或增加某结点的支持数,而是建立根的新子树或者向新子树上增加结点或增加某结点的支持数。算法只对新增的频繁项目进行处理,对于支持数不变的频繁项目不再进行处理。试验结果表明该算法比同样基于FP树的传统算法挖掘最大频繁项目集的效率更高。
其他文献
随着网络技术的发展和网络规模日益扩大,网络拓扑结构和网络设备日趋复杂,承载的业务种类也逐渐增多,这些都使网络中出现故障或遭受攻击的可能性大大增加,网络检测面临更大的
随着新时代的不断发展,网络中业务规模和复杂程度的增大,新型网络架构——软件定义网络(Software Defined Network,SDN)受到追捧而逐渐流行开来。然而SDN在给网络建设提供便
随着计算机网络与嵌入式Internet技术的飞越发展,视频监控系统网络化的趋势越来越明显,它将改变现有的视频监控系统体系结构,逐渐向体积小、功耗小、稳定性高、扩展方便、IP监控
随着社会的快速发展,第三方物流企业间的竞争越来越激烈,以流程为核心对企业中不合理的业务进行重组,可以降低第三方物流企业在时间和成本方面的消耗,改善客户服务质量,进而
本文以在现实环境中已经运行的视频联网监控系统为工程依托,在其基础上研究设计了一种无线Mesh网络接入该系统的机制,使系统的应用与无线网络有机融合,真正做到随时布控和无
企业信息化建设过程中实施了许多应用系统,但由此引发了系统孤岛、数据异构等不支持综合查询的实际问题。因此,对建立“一站式”综合信息查询系统有强烈的应用需求,屏蔽各异
搜索引擎技术是在当前各领域对计算资源和计算能力不断增长的形势下发展起来的,而基于链接分析的PageRank算法的研究更是其至关重要的一个环节,目的是对搜索的网页进行重要性
电子表单是生产活动中表格和单据的电子形式,是信息系统的重要组成。电子表单系统作为设计电子表单的软件平台,简易高效的设计平台,可提高表单的设计、维护和使用效率。论文
随着网络通信技术的不断发展,尤其是因特网和局域网技术的不断成熟,在加上计算机技术的不断发展,其性能的不断提高、成本的不断降低,使得计算机网络像雨后春笋般在社会中发展。在
随着社会全球化经济的不断发展,企业规模迅速扩大,对海量数据的处理要求必然越来越高,这就需要一个高性能数据库的支持。IBM的DB2数据库系统就是一款高性能的关系型数据库系