关联规则挖掘及贝叶斯网表示研究

被引量 : 0次 | 上传用户:ASHLEY920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和自动化数据采集的广泛应用,在各种应用领域里的数据库中存贮了大量的数据,这使得人们对这些数据进行分析并转化为有用知识的需求变的越来越迫切。于是,数据库中的知识发现(Knowledge Discovery in Databases, KDD)自然成为近年来人们从大型数据库中获取信息的一个重要研究领域。关联规则分析是其中的一个重要分支,它用于发现存在于数据库中的项或属性间的有趣联系,这些联系是事先未知且隐藏的,即不能通过传统的数据库逻辑操作或统计的方法得出。关联规则挖掘就是利用特定方法发掘数据库中潜藏的关联规则的过程。目前,面向传统关联规则即正关联规则的挖掘已经有了很多成熟的、经典的算法,其中最为重要、最为经典也是最有影响力的两种算法为Apriori算法和FP_growth算法。这两种算法在开采频繁项目集集合时一个使用的是广度优先的搜索策略,一个使用的是深度优先的搜索策略,二者各有优缺,后来产生的种种算法大多是在这两个算法的基础上作的改进。2002年,XinDong Wu在传统关联规则的基础上进行了扩展,提出了负关联规则,即形如A ? ? B, ? A ? B, ? A ? ? B的关联规则,负关联规则对事务集中项的状态进行了扩展,它不仅研究各项出现之间的关系,还研究各项出现与不出现的关系。同传统关联规则挖掘相比,负关联规则挖掘研究起步晚且难度更大,本文分析了负关联规则挖掘的特点,比较了现有各种负关联规则挖掘算法,在此基础上,提出了一种能够同时挖掘正、负关联规则的算法,该算法是由Apriori改进而来的,在寻找频繁项目集的过程中将非项加入了迭代,在生成关联规则的过程中又引入了兴趣度标准来对挖掘得来的规则进行删减。经过理论分析和实验证明该种算法有效且可行。关联规则的形式简单,应用起来高效、便捷,但是由于关联规则不能表达不同规则之间的联系,所以在某些比较复杂的应用领域中,当需要综合考虑多种因素对结果的影响时,关联规则的应用就比较困难。而贝叶斯网是一种图型化的模型,能够图形化地表示一组变量间的联合概率分布,所以在对节点状态进行推理的过程中,能够综合考虑各个因素(父节点)的影响,针对此种情况,本文提出了一种基于贝叶斯网的关联规则表示方法,把关联规则从数据中挖掘出来后,经过结构学习和条件概率表的学习,最终将原来的规则以贝叶斯网的形式表示。从而有效地扩展了关联规则的应用。已经证明,在一般的贝叶斯网上的推理问题是一个NP问题,按照本文前面所述的转换方法得到的贝叶斯网满足原因独立性,所以本文介绍了一种采用原因独立性对贝叶斯网变形的方法,在经过变形的贝叶斯网上进行推理,可以使复杂度大大降低。
其他文献
工厂中在役的DCS种类繁多,为解决不同DCS厂家、不同DCS版本与上层应用之间的数据采集交互问题,提出了DCS生产数据采集网络平台的概念,针对该平台设计中涉及的抽象任务多线程
<正>为了进一步推行行贿犯罪档案查询制度,更好地发挥这项制度的功能作用,有效服务经济社会科学发展,2013年1月16日最高人民检察院第十一届检察委员会第八十四次会议通过了《
<正>我国检察机关的检察委员会是中国特色社会主义司法制度、检察制度的重要组成部分,是人民检察院内部实行集体领导决策的重要组织形式"。这种
目的 :观察微创综合疗法治疗 Bell面瘫的疗效。方法 :治疗组 6 8例采用微创治疗 ,即患侧足三里穴埋线、中药薰洗热敷、面部穴位按摩 ,对照组 3 0例常规针刺配中药内服。结果
推行精准化管理是现代管理的趋势。对原有的管理模式进行改进、优化、提升,积极寻求与探索符合司法工作规律和检察工作特点的精准化管理模式,是检察管理科学化、规范化的必然
<正> 我区每年都有一部分早、中稻栽后秧苗黄瘦发僵,迟迟不发,长相犹如“一柱香”,严重的稻苗发红,老叶有褐色斑点,心叶往下缩,增施氮肥,效果也不大。气温升高后,虽能继续生
如何有效的惩治贪污贿赂犯罪问题一直以来是法治社会治理的重要问题,贪污贿赂行为是社会发展的毒瘤,在我国的贪污贿赂犯罪的司法实践中,暴露出立法与执法存在脱节的问题。通
修改后的刑事诉讼法对侦查阶段辩护律师的会见权、提出意见权、申诉控告权以及人身保障权等作了较为细致和全面的规定。由于相关司法解释对职务犯罪侦查中辩护律师会见犯罪嫌
在众多的热浸镀层中,热浸镀Zn(GI)、Zn-5%Al-0.2%RE(GF)和Zn-55%Al-1.6%Si(GL)合金因其具有良好的耐蚀性、牺牲阳极性能和机械加工性能而广泛应用于建筑、机械、汽车和桥梁等