数据挖掘中的关联规则技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:mucao_xkhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘作为数据挖掘领域的一个重要研究内容,它揭示了项集之间有趣的相关关系,可广泛应用于购物篮分析、相关分析、分类、网络个性化服务等领域。自1993年R.Agrawal等首次提出该问题以来,一直是数据挖掘研究和应用领域活跃的前沿。典型的关联规则发现算法是由R.Agrawal等提出的Apriori算法,其核心技术为其它各类关联规则挖掘算法所广泛采用。然而,随着分布式环境的日益普及,采用传统的集中式关联规则挖掘方法不能高效地发现存在于分布式信息系统中的关联规则,设计高效的分布式关联规则挖掘算法就成为关联规则研究的一个重要内容。本文在研究已有的分布式关联规则挖掘算法的基础上,针对其不足,给出了一种高效的分布式关联规则挖掘算法(ED-ARM—Efficient Distributed Association rules Mining),以快速地发现存在于分布式事务数据库系统中的全局频繁项目集。对该算法所进行的分析和试验结果证明,该算法是高效可行的。另外,当数据库或挖掘参数发生变化时,如何高效地对频繁项目集进行更新是关联规则挖掘研究的另一个重要内容。本文就频繁项目集的更新问题进行研究,给出了一种基于频繁模式树的频繁项目集增量式更新算法(FIUP—Frequent Itemsets Incremental Updating)。该算法充分利用已有挖掘结果,有效解决了最小支持度和事务数据库同时发生变化时相应频繁项目集的更新问题,其中事务数据库的变化同时包括增加和减少两种情况,并对其性能进行分析与测试,结果证明,该算法是有效的、可行的。
其他文献
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。近年来在机器
学位
计算机取证技术近年来获得飞速发展。与此同时,随着计算机犯罪的多样化以及民事调查类型的增多,计算机取证分析师却在多方面面临着挑战,如:海量数据、案件复杂程度的增加、取证结
学位
随着网络流量快速增长,人们对带宽的要求越来越高。WDM网络被认为是下一代网络中解决带宽问题的最具潜力的光网络之一。网络编码打破了传统网络中处理信息的方式.在传统的网络
随着网络技术和存储技术的发展,以及多媒体应用的普及,互联网上音频数据的数量迅速增长。广播、音乐、电影/电视伴音、教学录音等音频资源目前都可以通过互联网获取。如何有
计算机模拟是研究光化学反应的一个有效手段,该方法可以在分子水平上观察化学反应,追踪分子运动过程。本文针对可用计算资源无法满足研究小组计算需求,而购买专用服务器价格
学位
中文命名实体识别是中文自然语言处理技术的基础理论,而在命名实体中,人名是识别难度最高、所占比例最大的一个类别。人名是影响分词准确度的重要因素,而且分词系统中通常具有人
粒计算是信息处理的一种新的概念和计算方法,覆盖了所有和粒度有关的理论、方法、技术和工具,现已成为人工智能领域中一个新的研究热点。粒计算在很大程度上模拟了人脑认识和
学位
随着网络上Web服务的数目正以惊人的速度增长,为了区分功能相同或类似的语义Web服务,人们通常采用QoS(Quality ofService,服务质量)作为评价和衡量的标准,因此需要基于QoS进
移动代理通过在不同的主机之间迁移代码,将远程协作的计算模式转化为本地交互,交互的结果由移动代理带回源主机。该模式减少了分布式软件在远程协作时产生的网络流量,具有自适应
学位