论文部分内容阅读
论文首先对Apriori核心算法进行分析,并指出了值得改进的地方。文中设计了新的基于兴趣度和Apriori的改进挖掘算法。分析了由此而引起的概念树高层规则的遗漏问题,提出了自顶向下法和自底向上自适应法的解决方案。接着讨论加权关联规则挖掘算法,提出了加权关联规则的概念和四种挖掘算法或思想。并且详细分析了这些算法的复杂性和他们各自的实际应用意义。特别是在基于FP-growth的加权规则挖掘算法设计中,熔合了加权规则挖掘和FP-growth算法的思想,并从重新定义了加权支持度,设计了加权频繁模式树的算法。不但使得加权规则挖掘算法复杂性降低近乎一个数量级,而且使得算法更加适合实际应用。
最后,讨论了当事务数据库变化,最小支持度门限值和可信度门限值发生变化情况下的更新算法。
整篇论文涉及了兴趣度,加权关联规则挖掘算法,平行化设计和分析。