关联规则并行算法在社保审计中的应用研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:liyongrubylian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则(Association Rules)是挖掘发现大量数据中项集(Itemset)之间有趣的关联或相关联系,是数据挖掘领域研究的一个重要内容。将关联规则应用于社会保障数据,可以发现一些潜在的规律来辅助计算机审计社会保障数据。面对社会保障庞大的数据量,关联规则并行数据挖掘成为有效的方法之一。本文首先说明了社会保障审计的意义,分析了数据挖掘中的关联规则分析技术在社会保障审计中的作用。其次介绍了数据挖掘的发展、研究方向、应用和关联规则(关联模式)的基本概念、常用的算法和扩展算法,以及关联规则并行方面的算法和成果。然后通过具体分析社会保障数据的特点,将关联规则的抽样并行算法引入了社会保障数据的审计中。本文设计实现了4个结点上的关联规则并行抽样算法,并将其首次应用于社会保障审计领域。关联规则并行抽样算法共分为两大步:一、各结点独立使用关联规则经典算法APRIORI挖掘各自的数据。二、设计将各结点的挖掘结果传输到根节点,汇总各结点的挖掘结果,得出关联规则关系。对于社会保障数据的分割,在实验的基础上,经过比较按时间顺序划分、按所属区域划分和按随机策略划分的结果,选用精确度较高的按时间顺序划分方式。根据数据的特点,在数据挖掘的数据预处理阶段,主要进行了数据抽取、数据转换和清洗、数据加载等。本文将数据挖掘中的关联规则并行抽样算法与社会保障审计结合起来,利用关联规则的技术来发现社会保障数据中可以帮助审计得潜在知识,在取得较为理想的结果的同时,提高了数据挖掘的效率。
其他文献
物体的三维数字化技术在军事、现代医学、历史文物研究等方面有着重要的应用价值。对于无纹理或若纹理的静态刚性体(rigid-object),传统的双目视觉和结构光的方法可以较好的恢复
目前Web数据挖掘的研究有很大一部分集中在Web日志挖掘上。Web站点的日志记录了Web站点浏览者的所有动作,通过对这些记录进行挖掘,找出浏览者的喜好,对Web站点的优化有指导意
最优控制、模式识别以及图像处理等应用是自然和工程领域中常遇到的优化问题。数值计算的方法是传统上用来解决线性或非线性规划问题的一般方法,但由于其计算解的时间复杂度
查询优化是数据库管理系统设计和实现所采用的一项重要技术,也是影响数据库系统性能的一个重要因素,当前所有商用数据库都成功采用了这项技术。关系数据库系统和非过程化的SQ
外部特征提取及识别作为数字图像处理的关键技术之一,由于其广泛的应用,受到国内外学者越来越多的研究和关注。外部特征识别存在的主要问题和难点包括光线噪声等干扰处理、特
分形理论是非线性科学研究中十分活跃的一个分支,它的研究对象是自然界和非线性系统中出现的不光滑和不规则的几何形体,它发展极其迅速,新成果层出不穷。利用分形公式在计算
随着计算机信息技术的不断发展和电网规模的不断扩大,三维电力地理信息的可视化表示已经逐渐成为电力GIS领域的一个研究热点。本文结合了三维电力地理信息系统的特点,分析和研
机器学习是人工智能和计算机科学领域的一个永恒的课题。目前人们比较公认的机器学习概念的说法是Simon对学习的阐述:“如果一个系统能够通过执行某种过程而改进它的性能,这
心脏是人体重要器官之一,心血管病又是人类三大疾病之一,因此对于它的生理病理研究具有重要意义。为了更好地诊断和治疗各种心脏病,更好、更安全地研发治疗心脏病药,人们一直
运动机器人的追踪避障技术,一直是机器人技术研究中一个比较活跃的分支,也是一个多学科交叉的综合性课题。该课题涉及视频采集、图像处理、视觉测距、立体匹配、地图构建、路径