关联规则算法研究及其在铁路隧道安全管理中的应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:alikeboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是伴随信息量的迅速增长而诞生的,如何满足人们对知识与信息的渴求,以便快速地获取知识以及应用于决策领域,已经成为当前信息处理中的热门课题之一。数据挖掘的方法很多,其中关联规则挖掘是一种主要的也是用途最广的数据挖掘方法,关联规则概念最早是由在IBM工作的Rakesh Agrawal博士等于1993年提出的,用于刻画事务数据库中各交易项目之间的关系,即频繁关系,自此,对关联规则的研究已有10余年时间并取得了很多成果,但还有很多问题亟待解决。本论文对此作了详细介绍,并对关联规则挖掘理论特别是关联规则挖掘算法进行了深入研究,取得了一定的研究成果。文章首先介绍了数据挖掘的内涵、过程和一些方法,并简介了国内外目前的研究现状。关联规则方法是被实践(沃尔玛)证明了的一种非常有用的数据挖掘方法。关联规则的主要任务就是获得频繁项集,获得频繁项集的经典算法是Apriori算法和FP-growth算法,从算法的数据结构看这两种算法分别是基于数组和基于树的;文章还介绍并分析了Apriori算法的几种改进算法AprioriTid和AprioriHash等,同时还介绍并分析了FP-growth算法的改进算法PFP-growth。在总结了这些算法的特性后,作者提出了基于数组的AprioriN算法,此算法通过编码的方式把对数据库的操作转化到对内存的操作上,虽然此算法对处理机的内存要求较高,但大大提高了算法的效率;同时还提出了基于FP-tree的高性能关联规则挖掘算法FP-growthN算法,可以通过增加一个额外的数据结构加快项集的遍历速度,在第二遍扫描数据库时,建立基本FP-tree(Tφ)的同时生成一个矩阵Aφ,这个矩阵用来保存频繁2-项集。我国的铁路隧道多数存在病害,以往大量历史病害数据没能为治理和防治工作提供有效的决策支持,而数据挖掘的关联规则方法可以通过挖掘历史数据为隧道病害防治和治理提供有效指导。由于作者提出的新算法FP-growthN特别适合那些数据量很大但数据项很稀疏的数据挖掘,文章将这种新算法应用于挖掘铁路隧道各病害的关联,通过对成都铁路局掌握的2005年的2787条隧道病害数据的343条重点隧道有效病害数据的关联分析,找出了各隧道病害之间隐藏着的关系,对
其他文献
网侧变流器在风力发电机组中一直扮演着重要的角色,而随着系统功率等级的增加,LCL滤波器在并网变流器中的应用也越来越广泛。由于LCL滤波器为三阶系统,控制比较复杂,稳定性变差,且目前的常用的控策略未能实现网侧电流直接控制。针对这些缺点,首先对带LCL型滤波器的三相电压型PWM变流器(LCL-VSC)进行数学建模,研究系统中各变量对控制的影响,从而为控制策略的提出奠定充分的理论基础。在对控制对象充分研
随着计算机技术、现代通信技术和自动控制技术的迅猛发展,嵌入式技术在国防、能源、交通、工业等领域的应用也越发广泛,而智能建筑无论在工程建设领域,还是在其相应的学科学术理论研究方面,也进入了飞速发展时期。在当今的楼宇自动化控制领域中,对设备控制的复杂性及效率越发严格,8/16位单片机在速度、通信和控制的复杂程度上都难以再满足楼宇控制系统的要求,基于32位的RISC处理器的嵌入式技术在楼宇控制器中的应用
随着中国智能电网的投资建设,智能配电网的结构和功能日益完善。电网的故障自愈性是对智能配电网的基本要求,也是智能配电网功能上的重要特征。现阶段我国配电网主要采用消弧
Delta补偿式UPS是具有综合补偿能力的UPS电源,该装置既能抑制电网电流谐波,又能补偿电网电压波动以及无功电流,隔离电网和负载。无论是电网还是负载任何一方出现电能质量问题
高频链矩阵整流器由输入滤波器、矩阵变换器、高频变压器、不控整流器以及输出滤波器组成,能够实现网侧单位功率因数,具有高频化、隔离变压、变换级数少,功率密度高等优点,该