基于粒计算与完全图的关联规则算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:yyy123yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为一门新兴的交叉学科,其主要任务是面对庞大的应用数据库,研究并探索有效的信息提取方法,从海量信息库中提炼隐藏的有用信息。本文在分析传统关联规则算法的基础上,发现大多算法产生频繁项集时需要先产生候选项集,并且需要多次遍历整个数据库进行模式匹配。为了提高算法的运行效率,本文利用粒计算计算代价小的特点,用粒计算代替传统的模式匹配;同时,为了避免对整个数据库进行扫描,提出利用完全图划分挖掘区域的方法,只在可能产生频繁项集的范围内进行挖掘。主要研究内容如下:1、GRC_G算法。总结学习他人经验,对粒计算理论进行分析,把粒计算引入到关联规则挖掘中,提出了二进制粒和完全组合粒的概念;提出一种利用完全图缩减挖掘区域的方法。最后,给出该算法,并通过仿真实验证明了该算法具有较好的性能。2、T_GRC_G算法。分析常见的实际数据库中记录信息的多种属性特征可知,其中所蕴含的某些属性间的关联规则往往是遵循一定的规律成对共存,然而进行简单的频繁项集挖掘不能有效地发现这些规则。因此对GRC_G算法进行改进,并提出了挖掘双向关联规则的算法T_GRC_G。建立强双向关联规则和强弱双向关联规则的概念;为减少冗余规则的产生,提出一种删除冗余规则的方法。给出该算法,并通过仿真实验证明该算法能够有效地减少冗余规则的产生,并且能够发现也许会更有意义的强弱双向关联规则。3、MD_GRC_G算法。GRC_G算法虽然有效,然而在很多情况下,人们感兴趣的知识往往出现在多维空间中。为此,以GRC_G为基础提出该多维关联规则挖掘算法,通过事务投影的方法挖掘多维频繁项集,并在此基础上进行关联规则的产生。给出该算法,并通过仿真实验证明了该算法能够有效地发现多维关联规则,并且时间效率较高。4、为了更好的证明本文所提出的改进算法的有效性和实用价值,本文在实验室仿真测试算法性能的同时,选择中医药方剂数据库进行实际挖掘实验。实验结果表明本文的改进算法确实能够有效地发现实际应用中的有趣关联规则。目前,中医药领域尚未有引入数据挖掘理论进行研究的完善而成熟的先例。
其他文献
根据两种群密度之间作用的影响,通常把两种群Lotka-Volterra模型分为三类:捕食-被捕食,竞争和互惠.由于捕食-被捕食和竞争关系在自然界的广泛存在性和重要性,过去四十年这两类模
本文我采用了Mironenko[1]创建的反射函数法研究了双摆振动系统(x1x2)=A(t)(x1x2)(1)(y1y2)=B(t)(y1y2)(2)的同相振动性.其中A(t)=(aij(t))2×2,B(t)=(bij(t))2×2.   假设
函数S-粗集的概念在2005年一经提出,便引起了广大学者的青睐,随着对函数S-粗集研究的不断深入,其应用领域也不断扩大,目前已成为进行数据分析、规律挖掘等不可或缺的数学工具。本
本文主要介绍了有重叠的情况下线性迭代函数系统的性质,并将相关结论具体应用到正方形的例子中。全文围绕Sidorov2007年发表的有重叠的线性迭代函数系统展开,共分为两个部分。
万亿矿藏要转化为实际财富,需经多重环节,目前阿富汗想要完成其中任意一环都困难重重,还可能引发国内大规模的争矿大战。    6月中旬,《纽约时报》披露,美国国防部和地质勘探局近年在阿富汗联合探矿,发现价值上万亿美元的金属矿藏。这个消息让西方媒体为之一振,美欧等国纷纷规划赴阿富汗淘金的宏伟蓝图;这个消息也让贫穷的阿富汗人激动万分,好像国家富强、安定团结指日可待。然而,万亿矿藏要转化为实际财富,需经历开
随着我国国民经济的不断发展,发展高速铁路和客运专线是我国铁路现代化建设的必然趋势。我国的铁路电气化迎来了前所未有的快速发展的春天,真正意义上的高速铁路时代已经到来。
本文首先介绍Rockafellar凸分析中回收锥、回收函数概念的提出,并将其中所介绍的回收锥、回收函数的性质进行归纳整理。 第二部分介绍回收锥、回收函数的某些理论及应用研
学位
众所周知,在科学技术的许多领域中,都会遇到微分方程初、边值问题,然而只有十分简单的很少一部分微分方程能够求得其解析解.对于那些复杂的而又常见的微分方程,如椭圆型、抛物型
本文研究一类具有分布时滞和含马尔可夫(Markovian)参数切换的离散时间的神经网络的稳定性和状态估计问题.所考虑的神经网络有若干有限的态式,并且这些态式的切换服从某个马尔