面向增量更新的数据挖掘算法及其应用研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:weiying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的数据挖掘算法都面向静态数据,而数据库中的数据却日益更新,造成数据挖掘的结果不及时,从而影响了正确判断和决策,因此研究面向增量更新的数据挖掘算法具有重大的意义。本文主要研究关联规则和聚类的增量更新挖掘算法。提出了新的关联规则增量更新PFUP算法,该算法借鉴强频繁项集概念,利用强频繁项集连接生成小数量的候选项集,采用了预剪枝策略减少了对数据库的扫描次数。仿真实验表明,在相同的数据库和支持度的情况下,PFUP算法的执行时间比FUP算法减少了50%左右。然后,在PFUP算法上,引入了事务压缩优化措施,实验仿真证明该算法具有更好的优越性。重点研究基于密度的增量聚类挖掘算法,介绍DBSCAN算法的基本概念和算法思想以及目前两种基于密度的增量聚类算法。由于增量聚类算法只是考虑数据库增加和删除的情况,提出了当MinPts发生变化的增量聚类算法UDBSCAN,并通过实验仿真得到理论的正确性。最后,在医疗保险系统中应用并实现了一个OLAM应用模型。该模型使用浙江省某市医疗保险数据库中2005年的医保数据,建立了面向医疗保险费用和诊断项目为主题的数据仓库,从多维的角度来分析数据,并通过关联增量算法挖掘出及时的且具有价值的信息。
其他文献
在计算机辅助教学(CAI)软件的开发中,基于题库的自适应测试系统已成为一个重要的发展方向。目前在国际上最新的测试理论研究成果是项目反应理论,本文介绍的就是一个采用项目
BWDSP是一款高性能数字信号处理器,同时兼容16位和32位定点数据格式,采用超长指令字架构,具有强大的并行处理能力,能较好的满足高速实时信号处理的应用要求。BWDSP具有多个执
随着PC技术、多媒体技术和网络技术的高速发展,数字图像逐渐成为信息的主要载体,并且在各行各业都得到广泛深入的应用。随之也逐渐形成了各种图像数据库。如今,大部分的数字
链编码是数字图像处理领域中重要的工具,它将二维的数字图像通过一维的编码表示,大幅度减少了存储空间,各种链编码的优良特性也给数字图像处理和分析带来了便利。获得图像的链编
支持向量机算法是统计学习理论中最年轻的分支。它以统计学习理论中的VC维理论和结构风险最小原理为基础,根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折衷,获得了
本文针对目前Internet上信息获取存在效率不高与“资源迷向”的问题,以及日益增长的个性化需求,提出了一个面向Web的基于XML的个性化信息检索系统模型,研究了其中的关键算法,所研
网络的安全问题越来越受到人们的重视。研究人员围绕如何有效检测出系统和网络中的异常行为进行了大量深入性的探讨。由于生物免疫系统承担着与入侵检测系统类似的任务并且能
嵌入式系统仿真的核心工作就是指令集仿真,但纯手工开发一个指令集仿真器不但是一项繁重的工作,而且极易出错。还需要花费大量时间来进行仿真器正确性的验证。本课题研究了各
语义Web(Semantic Web)是万维网之父Tim Berners-Lee倡导的下一代万维网,是对当前万维网的扩展。语义Web研究的主要目的就是增强Web资源的语义表示,以一种明确的、形式化的方式
互联网给人们带来巨大方便之时,也给人们带来了网络安全问题。于是入侵检测(IntrusionDetection)技术也就应运而生。入侵检测是网络安全领域新兴的研究课题,相对于传统的操作系