MS-Miner:一种新的频繁项集挖掘算法

来源 :兰州大学 | 被引量 : 0次 | 上传用户:zhengwei129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁项集挖掘可以广泛应用在关联规则挖掘、相关性分析、入侵检测、序列模式、分类和聚类等多种数据挖掘任务中。迄今为止已经提出了许多高效的频繁项集挖掘算法。本文对大量频繁项集挖掘算法进行了深入的研究,重点分析了几种经典模式增长算法中事务数据库在内存中的存储结构,以及各种有效的实现技术,并在此基础之上提出了新的算法。首先,对关联规则和频繁项集挖掘的相关概念、研究现状及所面临的问题进行了分析研究。并对几种典型的频繁项集挖掘算法进行了详尽分析,比较了它们各自的优缺点及适用环境。其次,对大量已有算法中事务数据库在内存中的存储结构,以及各种有效的实现技术进行了详细研究,重点分析了几种经典模式增长算法采用的数据结构和挖掘策略。最后,对三种采用的技术—FP-Tree、FP-Array以及Bitmap-Count进行了详尽地探讨,并在此基础上设计出了一种新的频繁项集挖掘算法—MS-Miner。实验结果表明MS-Miner算法不仅在算法执行性能上更优,而且在内存消耗和可扩展性上都有较好的表现,是一个高效的频繁项集挖掘算法。
其他文献
随着数据挖掘研究的深入,越来越多的问题呈现在我们面前,也提出了更高的要求。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理论研究,并试图利用结构化数据
DNA计算以其海量存储和并行运算能力,从理论上可克服电子计算机存储量与运算速度上的不足,成为NP完全问题和其它难解问题的潜在解决方案之一,并且在理论上已成功的在多项式时
在金融管理、空中交通管制、通信网络管理等领域存在很多复杂问题,单个Agent解决不了,因为资源或者能力有限,而多Agent系统提供了解决这些问题的可能。但随着科学技术的发展,
数据集成技术为企业解决跨多平台,异构数据的集成问题提供了一条解决途径。数据集成系统可以把企业内部的各种相关数据资源进行集成、共享,为消除信息孤岛,也为企业的信息资源规
决策是当前人工智能和机器人领域的关键问题,它的涵义十分广泛,从逻辑推理、专家系统到多主体协作、多主体对策、实时规划、机器学习等各种领域,都属于或涉及到智能决策的问题。
地理信息系统(Geographical Information System,简称GIS)以数字化的形式反应人类社会赖以生存的地球空间的现势和变迁的各种空间数据以及描述这些空间数据特征的属性,支持空间
城市报警与监控系统是公安机关进行预防、控制和打击各种暴力、犯罪活动的重要技术平台,依托公共网进行构建,如何确保内部网络安全以提供方便、快捷的接处警服务显的至关重要。
串匹配问题是计算机科学中的一个基本问题。精确串匹配技术要求模式与正文子串完全匹配,不允许有错误。但是在许多实际情况中,并不要求模式与文本子串完全精确匹配,因此人们引入
人工智能是计算机科学的一个分支,是研究解释和模拟人类智能、智能行为及其规律的一门学科。自主机器人的研究是目前国际人工智能的重要研究方向之一,而国际机器人足球比赛(Rob
无线Mesh网络和无线传感器网络是两类特殊的无线自组织网络。无线Mesh网络主要应用于替代传统的用于连接最终用户的最后一英里线路,以降低接入用户的布线成本。无线传感器网络