时序关联规则挖掘研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jmshello
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘又称数据库中的知识发现,是数据库研究最活跃的领域之一,这门技术自兴起以来因其广阔的应用前景和深远的现实意义受到学术界的广泛关注,而其中的关联规则挖掘问题,因其丰硕的研究成果和自身理论的逐渐成熟,正在形成一个比较完善的研究体系并带动整个数据挖掘技术快速发展。 自从Agrawal等学者于1993年首先提出了关联规则挖掘问题以来,诸多的研究人员对关联规则挖掘问题进行了大量的研究,提出了很多高效的算法,然而大多数方法都未考虑时间因素的影响。但在现实世界中,时间是数据本身固有的因素,在数据中常常会发现时序语义问题。时序数据的出现使得有必要在数据挖掘中考虑时间因素,在现实中,附加上某种时序约束的规则将可以更好地描述客观现实情况,因而也会更有价值,称这样的规则为时序关联规则。 现阶段对时序关联规则的挖掘主要集中在周期性关联规则挖掘、循环关联规则挖掘和日历关联规则挖掘几个方面。由于周期性和循环模式是建立在单一的时间粒度上,而日历模式是建立在多时间粒度上,这与实际生活中的年、月、日,时、分、秒等多粒度时间表示更加吻合,因此基于日历的时序关联规则挖掘研究更有实用价值。 本文主要研究基于日历的时序关联规则挖掘。首先在查阅国内外大量文献资料的基础上,对数据挖掘技术和关联规则挖掘技术进行了概述,对关联规则挖掘的典型算法进行了分析,并对时序关联规则挖掘的概化算法进行了描述。然后基于日历代数,提出了一种基于日历的时序关联规则挖掘算法BCTAR,该算法旨在发现基于给定的日历格的所有的时序关联规则,即发现所有的频繁项集和日历模式的匹配,算法只需扫描数据库两次。另一方面,基于模糊日历代数,提出了一种模糊时序关联规则的挖掘算法BFCTAR,该算法旨在发现用户指定的复杂日历下所有的频繁项集。实验结果分析说明,这两个算法是高效、实用的。
其他文献
随着Web服务技术的发展,数据库同Web服务相结合,利用数据库强大的数据存储和管理能力,将其存储的数据以Web服务的形式提供给外部使用,或获取外部的数据到数据库中使用,已经成
无线局域网技术以其灵活、可扩展性、实时性和低成本的优点获到了广泛的成功。但是,无线局域网媒体有信道开放的特点,存在比有线网更加严重的安全隐患,如不加以解决,势必对无线网
模糊推理和态势评估分别是模糊控制和高层次信息融合的核心内容,也是人工智能研究的关键理论和技术.本文对战术态势评估的理论和模型以及模糊逻辑系统的构造及其完备性进行了
相变存储器由于具有非易失性、功耗低、读取快、存储密度高等优点,被认为有可能取代目前的闪存和动态随机存取存储器而成为固态半导体存储器的主流产品。然而,相变存储器的耐久
随着互联网的发展与普及,传统的数据库技术已不能满足海量数据分析处理的新要求。连接是数据分析的重要手段,对大规模数据进行预处理,可以减少连接时不必要的处理开销。然而现有
近年来,视频通信的技术的发展日新月异,人们对视频通信的需求也大大增加。随着智能手机以及WiFi和3G网络的兴起,人们越来越习惯于在移动终端上观看视频和视频通信。由于移动环境
随着3G技术的逐渐成熟,B3G技术开始研发,无线传输能力越来越强。用户可利用智能手机、PDA等移动设备,通过无线技术连接到网络,可随时随地的利用移动设备来存取网络中的资源。在许
数据丢失将给个人和企业造成巨大损失,数据存储的高可靠性和高安全性成了关注的重点。磁盘阵列在空间维度对数据进行保护,避免磁盘失效造成数据丢失,连续数据保护可以在时间维度
众所周知,竞技体育发展越来越迅速,竞争也越来越激烈,提高运动成绩的难度越来越大。为了在重大国际赛事和奥运会上取胜,世界体育强国都在力争运用最新的科技手段来挖掘人体运动的
随着多媒体计算机技术和网络技术的迅速发展,教学支持系统对统一性和开放性的要求越来越高,为了满足这种需要,组件技术正日益渗透到教学支持系统的软件开发过程中。 组件对象