关联规则挖掘算法研究及其在CRM中的应用

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:wyhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(或知识发现)出现于20世纪80年代末,目前已经成为人工智能和数据库等领域的研究热点。它有着广阔的应用前景,并将在新的世纪里在各个领域发挥其强大的生命力。R.Agrawal等在1993年提出了关联规则问题,现在关联规则已经成为数据挖掘研究的重要方向,并且吸引了众多专家和学者的关注。 本文比较研究了现有的关联规则挖掘算法如Apriori算法、增量式更新算法等,发现存在问题有二,其中之一是当数据库中增加新的数据时,多数算法要重新扫描整个大型数据库,效率较低。另一个问题是由于现有算法中项目集的支持度是基于整个数据库计算的,当新增的数据中出现新项目时,即使包含新项目的项目集频繁地出现,现有算法常把这些项目集作为非频繁项目集,由此产生的关联规则不能反映最近的商业活动。 本文根据以上算法存在的问题,首先提出了一个新的概念——敏感性,用来衡量各种关联规则挖掘算法对新项目的重视情况。然后一方面从改进算法的时间效率出发,引入一个参数c(1≤c≤∞),根据旧数据集的支持度大于或等于minsup/c的频繁项目集和新增数据集发现频繁项目集,而不需扫描整个旧数据集;另一方面从敏感性出发,对于只出现在新数据集中的频繁项目集,则直接作为整个数据集的频繁项目集。紧接着本文通过实验把改进的算法与增量式更新算法进行了比较分析。最后结合数据仓库知识,探讨了如何把关联规则应用于客户关系管理(CRM)中。
其他文献
工作流技术是近年来发展最迅速的几项新技术之一,其主要特点是实现人与计算机协作过程的自动化,使人以及各种应用工具相互之间协调工作,以完成某项任务.该文通过对基于Intern
工作流管理系统在当前的研究领域中,是一个热点.工作流管理系统对提高工作效率有重要的意义.目前已经出现了不少工作流产品和工作流原型系统,但是仍有诸多的局限性,如监控功
该文主要研究了跳频信号跳变时间的提取、快速跳频信号的测频以及跳频信号的网台分选.其主要工作可概括为以下几个方面.研究了小波变换提取跳频信号跳变点的问题.一是利用小
DPD(DistributedParallelDebugger)是基于Unix/Linux操作系统开发的源代码级并行调试器.DPD的设计采用分布式结构,主要模块包括:一个集成环境控制界面、一个数据流汇中心、多
本论文是上海市科委下达上海市计算技术研究所科研项目《全数字相控阵超声无损检测系统》的部分工作,侧重于算法的研究和实现。论文首先介绍了关于无损检测、超声波检测以及相
该文在总结现有方法的基础上,讨论并简单实现了一个基于潜语义标引技术(LSI)的全文信息检索系统.该系统试图利用潜语义标引技术,从文档中词语的使用模式来发掘文档的潜在语义
在网络应用日益普及的今天,大量各种类型的设备正在源源不断地加入网络之中。与此同时,网络使用与维护的复杂性也越来越大。人们希望当这些设备接入网络时,能够随时以一种简单的
数据备份技术是提高数据安全性和可用性的有效方法.在对备份方式,备份设备和关键技术研究的基础上,针对一种由双通道构成的海量存储系统,开发了专用的网络备份管理系统.通过