论文部分内容阅读
数据挖掘是一个涉及多学科领域的新兴学科,并随着这些学科的发展而不断发展,应用领域非常广泛,目前已经成为十分活跃的研究课题.关联规则的挖掘是数据挖掘课题中的一个重要分支,它被用来描述事务数据库中属性间存在的潜在关系.数量属性作为事务数据库中一种很自然的属性,有着广阔的研究前景和巨大的应用价值,所以,研究基于数量属性的关联规则就显得尤为重要.
本文对事务数据库中数量属性之间的关联规则展开研究,提出一种关联规则新模型:上界弱比例规则,并对模型、性质、挖掘、推理和应用五个方面进行研究和探讨,取得了如下研究成果:
1.研究了布尔关联规则与上界弱比例规则的关系,得出结论:作为数量关联规则问题的特例,上界弱比例规则是布尔关联规则的推广,任意一个上界弱比例规则都以一个布尔关联规则作为支撑规则,上界弱比例规则可以按照其支撑规则进行划分.
2.给出了一种深度优先的上界弱比例规则挖掘算法:UBBoundary算法,算法分析和实验结果均表明:UBBoundary算法能够胜任上界弱比例规则的挖掘工作.此外,还定义了上界弱比例规则的基,它可以代表一类上界弱比例规则.
3.上界弱比例规则表示了前件与后件之间一种不确定性推理关系,基于这种不确定性推理关系,本文给出了上界弱比例规则的两种不确定性推理方法,并阐述了它们的直观意义.利用这两种不确定性推理方法,在已知一些上界弱比例规则和事实的前提下,能够得到相应的结论.该结论可以用于数据猜测和异常值检测.
4.将上界弱比例规则与下界弱比例规则的不确定推理方法进行整合,得到新的WRR方法,从试验的结果看,该方法在重构丢失数据、预测和异常值检测的应用中表现出了令人满意的效果.