论文部分内容阅读
为处理模糊信息,1965年Zadeh 提出了Fuzzy 集理论,之后Fuzzy 集理论得到不断发展和完善,并成功应用于数据挖掘领域,相应的基于Fuzzy 集理论的数据挖掘算法研究较多并运用于实际工程项目中。但是,在随后的研究中有学者指出这种单值的隶属度也有不足,为了可以处理这类Fuzzy 集无法表示且具有模糊性信息的问题,1993年台湾学者Gau和Buehrer 提出了Vague 集理论,Vague 集可视为Fuzzy 集的推广,Fuzzy 集是Vague 集的一种特殊情况,它具有更强的表达数据模糊性和不精确性的能力。
论文研究基于Vague 集的关联规则算法,定义了基于Vague 集的关联规则,定义了新的基于Vague 集的Vag u e 支持度和Vague 置信度。在数据缺失下的布尔关联规则挖掘中,用Vague 集来处理数据缺失部分的信息,使关联规则的数据挖掘更符合实际要求,并给出了一种新的基于Vague 集的布尔关联规则挖掘算法VagueApriori算法,该算法将传统的布尔关联规则挖掘模型解决问题的范围扩大,可以处理数据缺失下的布尔关联规则挖掘问题,也能处理传统的布尔关联规则挖掘问题。最后,将VagueApriori算法进行了实现,采用C#语言编程实现该算法的核心部分以及与用户的交互操作,并对该算法的性能进行了简单的实验分析,最后通过一个实例来对VagueApriori算法进行检验和验证。
此外,论文通过研究Fuzzy 集上的直接聚类法,从而将Fuzzy 集上的直接聚类法推广到Vague 集上,给出一些建立Vague 相似关系的方法,分别用Matlab的M 语言编程实现这些计算过程,在给出几种构造Vague 集相似矩阵方法的基础上,将Fuzzy 集上的编网法和最大树法引入到Vague 集上,定义了Vague 关系图,并给出了基于Vague 集的Vague 直接聚类法:Vague 编网法和Vague 最大树法,然后将Vague 集上的Vague 直接聚类法与Vague等价聚类法进行对比研究。
最后,通过一个实例的对比分析验证了Vague 集上的Vague 直接聚类法比Vague集上的Vague等价聚类法计算更加简单,不会造成原始信息的失真,比Vague传递闭包法更加有效,分类粒度更细。