【摘 要】
:
随着信息技术的发展,海量数据库迅速增加,然而对其进行有效分析处理技术的缺乏,促使数据库中知识发现(Knowledge Discovery in Databases,简称KDD)技术的应运而生。数据挖掘(Data
论文部分内容阅读
随着信息技术的发展,海量数据库迅速增加,然而对其进行有效分析处理技术的缺乏,促使数据库中知识发现(Knowledge Discovery in Databases,简称KDD)技术的应运而生。数据挖掘(Data Mining,简称DM)是KDD中的重要过程,其是指从数据中提取有益的模式。而频繁模式(Frequent Pattern)挖掘又是DM中重要的研究问题。近年来的大量数据以数据流(Data Streams)的形式产生,这对挖掘数据流中的知识带来了新的研究挑战。挖掘数据流中的频繁模式已成为当前数据挖掘领域的一个研究热点。本文主要针对数据流挖掘中的重要问题之一——数据流频繁模式挖掘展开研究,主要研究内容和创新点如下:首先对数据流管理系统及数据流挖掘的现状进行了介绍,然后对数据流挖掘技术特点以及数据流频繁模式挖掘的基本概念和关键问题进行了介绍,最后对数据流频繁模式挖掘的几个典型算法进行了分析与探讨。其次,提出了基于滑动窗口的数据流频繁模式挖掘算法—MFIS-stream算法,该算法利用提出的数据结构FIS-Tree存储事务信息,进而获得数据流下的频繁模式,同时利用每条事务中设置的末节点对FIS-Tree进行更新。实验测试表明,MFIS-stream算法具有较好的稳定性和时间效率,适用于数据流下频繁模式的挖掘。最后,为了适应实际问题的需要,提出了加权频繁模式挖掘算法MFIWDS。该算法通过提出的WFIS-Tree树可以动态的调整要挖掘的窗口个数和宽度,并且能够根据用户的实际需求来确定不同事务的权值,挖掘出符合实际应用要求的频繁模式。实验测试和性能对比分析表明,MFIWDS算法是可行性的。
其他文献
随着无线传感网络(WSN, Wireless Sensor Network)技术的进步,WSN被应用于越来越多的领域,其主要功能是数据汇集。显然,只有当整个网络处于有效的工作状态,才能进行数据汇集
全球互联网技术的快速发展为网络安全提出了新的挑战,现存的安全信息系统和各种网络设备仅能从某一侧面来维护网络的安全。很多组织为了解决层出不穷的安全问题而购置了各种网
粗糙集理论是能有效地分析不一致、不精确和不完整等各种信息的一种数学工具,目前广泛应用于人工智能、模式识别和知识发现等方面,其研究的核心内容是属性约简。属性约简是在保
基于视觉的运动人体检测与行为识别涉及图像处理、模式识别的核心问题,在安全和军事等领域有广泛前景。因此在固定单摄像机下,研究运动目标检测与跟踪获取单人姿态序列,构造时空
随着PC机上很多新颖的3D应用被移植到移动设备上,而移动设备是电池供电的,因此其能量消耗已经成为一个迫切需要解决的问题。目前存在两种体系架构:传统的CPU架构和比较流行的C
生活中嵌入式系统的应用无处不在,从通信、消费电子产品到汽车电子、智能机器、工业控制和卫星导航,其使用数量已经大大超过了通用计算机,嵌入式设备以其低功耗、可靠性高、
虚拟现实技术和互联网的发展,以及人们对旅游需求的不断增加,使得作为新兴模式的虚拟旅游得到了世界范围内的青睐。对虚拟景区漫游系统的开发研究已经成为虚拟现实领域的热点。
常识推理中的信息常常具有不一致性、不完全性和不确定性。这样的信息不能看作绝对真理,而只能称为信念。对不一致信念的处理是人工智能特别是计算机推理研究中一个关键性的
随着网络技术的迅速发展,Web应用日益广泛,其自身安全也面临着越来越多的威胁。SQL注入漏洞攻击是针对Web系统最为常见、危害最大的一种网络攻击,主要通过寻找系统漏洞对后台
随着社会经济的发展,汽车的数量呈显著增长的趋势,一方面给道路交通带来了巨大的负载压力,另一方面,由于汽车的违章行驶行为得不到及时有效的遏制,对人们的日常生活产生安全