基于支持—置信框架理论的有趣关联规则的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zhuzhenxing1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术和信息技术的发展以及数据库的广泛应用,数据挖掘已经成为机器学习、人工智能、数据库等领域的研究热点.其中,关联规则在商业中的广泛应用使得它成为数据挖掘中最活跃的研究方向之一.在关联规则挖掘中,挖掘过程可以分为两个子问题:一是产生大项目集;二是产生强关联规则.对于第二个问题,目前的研究不太多,主要原因是忽视了一个问题,就是在产生强关联规则的同时,这些规则也必须是有趣的.通过关联规则挖掘,从大型数据库中发现了大量规则,如何选取有趣规则,是知识发现的重要内容.目前大多数的算法通常利用支持度和置信度来限定规则的强度.但在实际应用中仅考虑支持度和置信度是不够的,因为这些强规则并不一定都是对用户有用或者说是有趣的规则,它们中有的甚至是误导的.而我们的目的是找出决策的用户感兴趣的规则,所以对于关联规则挖掘中许多规则是无趣甚至是误导的情况,文中首先对其作了分析,针对项目集中可能出现的项目间的独立和负相关的情况,文中引入了概率论的统计相关概念,并在它的基础上定义了有趣度量RI,把有趣度结合导支持-信任框架的关联规则挖掘中.通过RI来约束用户不感兴趣的规则的产生.从而可以使挖掘出的规则更加有趣、有用.在对有趣度量做了理论和直观的分析的同时,文中还给出了算法设计和实例验证了它的有效性.同时该文定义了关联规则的覆盖和分解运算,使用这两运算我们可以解决关联规则的推导问题,因而用户只需存储很小的一部分关联规则,需要时再由已知的规则推导出未知规则,因而节约了时空开销.
其他文献
可变码率 (VBR) 视频已经成为当今宽带网络的主要业务流之一,它可以更加充分地利用带宽并提供更高的影像质量,现在广泛用于电影点播、视频监控和视频会议等领域。VBR视频的数
传统的网络安全产品管理复杂、缺少互动。针对这个问题,可以利用嵌入式设备建立安全联动系统来解决。为了降低问题的复杂性,将安全联动系统(Security Anywhere)分解为底层安
随着通讯技术的发展,带宽不断增加,通讯业务类型迅速增加,电信服务商不断提供各种增值业务以提高带宽的利用率,同时业务类型逐渐从窄带向宽带发展以满足不同的服务质量(QoS)
该文主要从现今IPv4地址资源紧张的情况出发,分析目前的网络管理软件中存在的缺陷,如对于网络节点的管理普遍依赖于IP地址进行,而在实际管理中,由于大、中型企业网络节点数量
水电仿真系统的目的是建立一个对实际水电厂的运行进行仿真的环境,用来培训运行人员,达到完成培训后即可上岗工作的要求,它是水电厂中运行人员对水电厂进行正常计算机监控和
随着计算机和因特网的日益普及,软件、音乐、电影、商业/技术文档等数字产品作为一种新的商品形式日益广泛地走进人们的生活。数字商品具有不占据物理空间、零质量、易于复制
随着信息高速公路的飞速发展,基于Internet的应用已经由单一业务类型向数据、语音、图像"三合一"的多媒体信息形式以及综合业务方向发展.目前主干网的链路容量已经有了新的突
网络渗透测试人员在渗透测试开始之前需要对目标进行侦察,目的是为了获取目标网络的IP地址、目标运行的操作系统以及应用程序列表。目前侦察工作主要借助相对单一的工具进行,渗
Internet的发展和普及正在极大的改变着人们生产、发布、消费数字内容的方式,但是随之而来的与知识产权保护相关的控制管理机制还远未成熟。所以,如何保证数字内容市场中交易
知识管理的基本目标是促进知识共享,其成效则集中体现在将有价值的知识应用于工作实践。鉴于知识往往隐含于信息体内容中,这使得如何将知识工作者和搜索引擎的注意力快捷地集中