关于数据挖掘中关联规则挖掘算法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:num184015922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文首先对Apriori核心算法进行分析,并指出了值得改进的地方。文中设计了新的基于兴趣度和Apriori的改进挖掘算法。分析了由此而引起的概念树高层规则的遗漏问题,提出了自顶向下法和自底向上自适应法的解决方案。接着讨论加权关联规则挖掘算法,提出了加权关联规则的概念和四种挖掘算法或思想。并且详细分析了这些算法的复杂性和他们各自的实际应用意义。特别是在基于FP-growth的加权规则挖掘算法设计中,熔合了加权规则挖掘和FP-growth算法的思想,并从重新定义了加权支持度,设计了加权频繁模式树的算法。不但使得加权规则挖掘算法复杂性降低近乎一个数量级,而且使得算法更加适合实际应用。 最后,讨论了当事务数据库变化,最小支持度门限值和可信度门限值发生变化情况下的更新算法。 整篇论文涉及了兴趣度,加权关联规则挖掘算法,平行化设计和分析。
其他文献
本文主要论述了CRM系统中数据挖掘技术的应用。文章首先对现有的数据挖掘过程及CRISP-DM标准进行了的详细分析,并结合实例介绍了CRM系统中数据挖掘技术的应用过程。在此基础上
随着Internet的快速发展和广泛应用,WWW(World Wide Web万维网)已经积累了数据巨大、领域广泛、内容丰富的信息,并成为人们获得信息与服务的重要途径。然而Web信息具有形式多种多
本文首先引入了一种基于机器学习规则的、用于入侵检测系统的动态模型,并对该模型加以改进,在误警率不变的前提下,使系统能够检测到更多的入侵种类,缩短了系统检测时间,从而提高了
本文在总结学术上已有关于计算机文字识别成果的基础上,描述了计算机文字识别的基本过程,介绍了几种常用的数字字符识别方法和汉字字符识别方法,对已有字符识别方法的改进主
目前存储系统的发展趋向于大容量、低成本和高性能,而任何单一的存储器件如非易失性随机存储器、固态盘、磁盘等由于其物理特性的限制,并不能满足以上需求。混合存储充分利用
该文从期货市场的实际情况出发,针对当前时间序列方法在期货预测及应用中存在的问题,采用范例推理技术弥补其在实际应用中的不足,从宏观上提出一个多层次范例推理的时间序列
电力系统远动技术从40年代到现在,经过了几十年的发展,出现了几代远动系统。电力系统远动技术已经成为电力系统安全经济运行必不可少的重要保障。但是,采用循环传输模式(CDT)或问答传输模式(Polling)的传统远动系统存在很多弊端,本文针对传统远动系统存在的缺点提出了一种基于嵌入式IP的电力系统远动技术。 文中针对基于嵌入式IP的电力系统远动技术所涉及的几方面问题进行了研究。首先...
机群文件系统提供的文件访问效率对整个机群系统的性能有着至关重要的影响,MOSIX负载均衡机群系统利用抢占式进程迁移和直接文件系统访问(DFSA)机制,实现了机群节点间的负载均
随着虚拟现实、分布式视算、分布式仿真和网络三维游戏的发展,对建模方法提出了更高的要求,这种建模与传统的CAD(Computer Aided Design)建模和动画建模有着本质的区别,不仅要求
在计算机网络中,多播是目前研究最多、应用最广的连接方式。实现多播的一般方式是建立多播树,多播树是根为源节点,且覆盖所有多播成员的一棵树。多播路由算法主要就是用来建立一