基于矩阵的加权关联规则挖掘算法研究

来源 :江苏科技大学 | 被引量 : 5次 | 上传用户:hartyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自20世纪60年代以来,数据库技术开始被广泛地应用于国家政府机构、商业部门和科研机构等领域。随着时代的发展,特别是互联网技术的出现,这些领域的数据库的数据呈现近乎几何爆炸式的增长,因此对海量数据集进行信息提取的需求就变得日益迫切。传统的数据库技术的局限性在于只能针对数据库进行查询和检索,而不能从数据库中提取知识,造成数据库中所蕴含的丰富知识不能被有效地发掘和利用,在这样的背景下就诞生了数据挖掘技术。数据挖掘被期望用来从历史积累的大量数据中挖掘出隐藏的规律或关联,从而为决策的制定和执行提供有力的参考和帮助。作为数据挖掘主要研究的方向之一的关联规则挖掘(Association Rule Mining) ,其主要是用于从数据库中找出数据项之间的关联关系,作为决策参考的依据。迄今为止,最有影响的布尔型挖掘关联规则算法是R. Agrawal等人提出的Apriori算法。但是基于经典Apriori算法的关联规则算法存在两个问题,需要多次扫描数据库和容易忽略出现频率小但是价值高的项目。Apriori算法在处理数据库中的各个项目时,是假设数据库中的每个项目具有相同的重要性,但是这样显然不符合实际情况。为了更合理地进行数据挖掘,人们引入了权重的概念使得挖掘的数据和潜在的模式更具有现实意义,因此需要利用现有的知识,对加权关联规则的研究进行认真细致的研究。本文对传统加权关联规则挖掘算法进行了改进,该改进算法采用矩阵和加权关联规则算法相结合的方法,并做了改进算法与传统加权关联规则挖掘算法的性能对比实验,得到的实验结果表明本文提出的改进算法在性能上优于原有加权关联规则挖掘算法。该改进算法的创新之处在于引入了矩阵思想,只需要扫描一次数据库来构建矩阵,给出了改进的权值定义,该定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据,解决了传统加权关联规则挖掘算法中加权频繁项集不存在普通关联规则中频繁项集所具有的反单调性的问题。
其他文献
计算机网络的发展推动了Web应用程序的长足进步,当越来越多的企业选择把自己的服务以网络的方式推广的时候,Web应用程序的安全问题也随之而来。开放网络程序组织OWASP每年召开
户外的摄影以及一些计算机视觉任务常常会受到恶劣天气的影响。在几乎任何一个户外场景中,从物体表面反射的光线,在到达相机之前,都会或多或少被空气散射所影响。这主要是因
数据挖掘就是从大量的原始数据信息中,挖掘出对使用者有意义的数据并以此指导着人们的实践,从而产生效益和利润等。本文在第二章简要概述了有关数据挖掘方面的理论知识,包括
现在社会已经处于并将长期处于大数据时代,海量数据具有4个V的特点,即数量大(Volume),多样性(Variety),需要处理的速度快(Velocity)和真实性(Veracity)。虽然目前的数据量很
煤场储煤量的盘点是火电厂燃煤管理的一个重要组成部分,关系到火电厂煤耗的计算和经济性指标。目前国内大多数火电厂仍采用人工盘煤的方法测量煤场的储煤量:即先用推煤机整形
在数字共焦显微技术中,为了获得物镜与载物台数十纳米的相对步进位移,需要通过驱动物镜与载物台的相对步进微位移,采集一系列不同截面的生物细胞的序列切片图像。而采用压电陶瓷
随着计算机网络和现代经济的发展,视频监控已近广泛渗透到了人们生活的各个方面,成为保障人们公共安全,打击违法犯罪,防止自然灾害发生的重要手段。运动目标检测作为视频监控
无线传感器网络是一种由大量廉价的传感器节点组成的多跳自组织网络。它的出现,极大地拓宽了人们获取信息的渠道,把客观世界的物理信息通过无线网络进行传输,给人们传递最直
近年来,随着高空飞行器技术和卫星技术的发展,以及侦察机和侦察卫星在军事领域的广泛运用,对伪装技术的要求也越来越高,特别是迷彩伪装,它已经成为一种对抗军事侦察和军事武
系统发育分析是生物信息学研究的重要领域之一,它主要研究同源的DNA或蛋白质序列,对这些序列进行进化分析,从而得到能够反映蛋白质序列或者DNA序列之间进化关系的系统发育进化树