数据流中的频繁闭合模式挖掘研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wenyueting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流是一种潜在无限的、连续快速的、随时间不断变化的数据序列,挖掘数据流中的频繁模式已成为数据挖掘的研究热点之一,许多数据流频繁模式挖掘算法被陆续提出。由于数据流中的频繁模式数量可能巨大,致使生成的关联规则数量也巨大,且含有很多冗余、无用的规则,不便于理解和把握。采用频繁闭合模式可以在信息无损失的情况下大大减少频繁模式的表示规模,已经成为一个重要的研究课题。本文对数据流中的频繁模式挖掘进行了研究,主要工作如下:(1)概述数据挖掘的研究背景,数据挖掘的主要任务,描述了数据挖掘中关联规则问题的定义、方法及主要算法等。(2)描述了数据流的特点和数据流管理模型,重点讨论了几种经典的数据流频繁模式挖掘算法。(3)阐述了频繁闭合项集的数学理论基础和定义,以及与频繁项集的关系,详细描述了挖掘数据库中频繁闭合项集的经典算法Closet。(4)在对数据流中的频繁模式挖掘问题的研究基础上,提出一种新的算法(AMFCIDS)来挖掘数据流中的频繁闭合模式,该算法采用DSFCI-tree结构存贮数据流中的频繁闭合模式,并随着数据流的流入不断更新DSFCI-tree结构,从而有效地挖掘整个数据流中的频繁闭合模式。实验及分析表明了该算法的有效性。
其他文献
语音情感识别是人工智能和机器学习领域的一个热点研究问题。研究者们通过发现影响情感的语音特征,利用HMM、SVM、KNN等分类器进行语音情感识别。当前的研究在有些时候可能会
非线性科学是一门研究非线性现象共性的基础科学,其中混沌理论是非线性科学的一个重要分支。本文利用理论推导和数值模拟相结合的方法研究了分数阶混沌同步控制中的相关问题,并
随着无线移动通信技术的发展,Wi-Fi手机成为了市场上的一个新兴热点。Wi-Fi手机是在以无线局域网(WLAN)和因特网(Internet)为基础的未授权移动接入(UMA)网络环境下支持IP电话
通过对当前游戏开发技术的研究发现:基于集中式的C/S架构的网络游戏平台已经不能很好地满足多人在线网络游戏关于可靠性和流畅度的要求。于是本文提出基于Peer-to-Peer(简称P2P
随着网络的进一步发展,尤其是宽带网络的普及,以视频、音频、电子书为代表的数字产品,以容易保存、便于复制、方便传播等特点得到了迅猛的发展。但是阻碍其发展的最大障碍也
随着Internet的快速发展,网络信息呈指数级急剧增长,信息获取的方式也多种多样。这种情况下,如何准确、高效地获取信息是研究人员和用户关注的问题。已有的独立搜索引擎各有
人脸检测,即给定任意图像,确定图像中是否有人脸,如果有人脸,则返回人脸在图像中的位置和范围。人脸检测是一项艰巨的任务,主要原因是人脸特征在人脸模式中的提取是一项非常艰难的
近年来随着许多P2P系统的出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在文件共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信
在当今的证券行业,集中交易已经成为必然的趋势,它给证券公司带来的优势是无法比拟的。所谓证券集中交易,就是采取业务整合、数据整合的方法,将当前证券公司基于营业部的、分散的
直接体绘制是体数据可视化的一种重要方法。体数据通常来自于计算机断层扫描(CT)、核磁共振成像(MRI)等采样设备,其他还包括如计算流体力学(CFD)、地震采样数据等。很多科学计