多维关联规则算法的研究与应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:g793202100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是目前发展最迅速的海量数据分析与处理技术。数据挖掘中的关联规则挖掘得到了人们极大的重视,并且已经在商业领域广泛应用。多维关联规则作为关联规则的一种重要形式,在近年来也得到了很快的发展。但传统的多维关联规则算法在数据量大或者频繁模式长时,有较大的时间消耗。 在单维的事务数据库关联规则挖掘中,FP-growth算法能大幅减少数据库扫描,并且不需要产生候选集,因而有很好的性能。本文通过改进FP-growth算法,提出一种高效的多维关联规则算法:MDP(Multi-Dimensional Pattern)算法。MDP算法通过构造一种扩展的前缀树MDP-tree,将数据仓库中的有效信息压缩存储,再使用基于MDP-tree的MDP-mining方法来快速发现有趣的关联规则。MDP算法仅需要扫描一次数据仓库,就可以构造出MDP-tree,进而得到所有的关联规则。该算法还具有频繁模式查找简捷、二次查询迅速等优点。本文通过实验验证了MDP算法对挖掘多维关联规则是有效的和稳定的,而且比传统的多维关联规则算法有更好的性能。最后本文将MDP算法应用于Web日志挖掘中,进一步验证了MDP算法的实际应用价值。
其他文献
有向传感器网络作为无线传感网络的一种高级形式,在诸多特殊场景中得到了广泛利用。由于其节点多为无线工作方式且能量无法得到补充,因此必须通过合理的节点调度来提高节点利
蚁群算法是一种最新发展的模拟昆虫王国中蚂蚁群体觅食行为的仿生优化算法。在解决许多复杂的组合优化问题方面,展现了优异的性能,但在解决实际问题中仍然不够成熟,还有很大的发
数据挖掘技术可以从大量数据中发现潜在的、有价值的知识,它给人们在信息时代所积累的海量数据赋予了新的意义。聚类分析作为其重要的组成部分,当前,在模式识别,数据处理,图
近年来,随着云计算规模的不断增长,高能耗已经成为云计算领域突出的问题,严重制约着云计算的发展。合理的资源分配和任务调度可以有效降低云计算系统的空闲能耗和执行能耗,从
微博是基于用户关系消息共享、传播和获取的一种媒介。与其他的网络应用平台相比较,微博具备更出色的时效性、便捷性和原创性,用户可以随时随地分享讯息,并且还可以和好友随时随
网格是构筑在互联网基础之上的一门新兴的分布式计算技术,它不同于一般传统的分布式计算,网格计算着重于大规模的资源共享、创新应用,并在一定情况下定位于高性能计算,已经成
随着对Web服务技术研究的不断深入,为了实现智能化的Web服务提供,出现了语义Web服务。语义Web服务是Web服务和语义Web结合的产物,它的目标是通过对Web服务进行语义描述,使其
随着图像传感器技术的发展,多传感器图像融合技术得到了迅猛发展,已经成为图像理解、计算机视觉等领域中一项重要的技术。多传感器图像融合就是把多个不同传感器获得的同一场景的多幅图像,或同一传感器在不同时刻获得的多幅图像合成一幅包含输入图像相关信息的图像的过程。通过综合利用不同图像之间的互补信息和冗余信息,获得对该场景更为全面、更为准确的图像描述。在多传感器遥感图像融合技术中,关于多光谱图像和全色图像的融
WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中
为了贯彻中央“让群众喝上放心水”的重要精神,促进农村供水现代化管理水平与效率的提高,提供实用供水信息化管理工具,作者受委托参与本课题,进行了某省农村饮水工程信息管理