数据仓库和数据挖掘技术在税务系统中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:liuyan881119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在税务系统实现数据仓库并以此为数据基础,实现联机分析和基于历史数据的数据挖掘系统具有重要和广泛的应用前景,但目前这方面的应用还在初步阶段。本文以税收征管业务为背景,针对数据仓库建设、联机分析和数据挖掘的各个阶段,深入研究了数据仓库的创建方法、联机分析方法与技术、关联规则数据挖掘方法,并根据税务系统业务特点,对现有的维间关联规则挖掘算法进行了改进。 本文在简要介绍数据仓库的体系结构以及创建数据仓库的各阶段任务的基础上,结合信息包的数据仓库创建方法,提出“搭积木”的方法来逐步完成各主题的扩充和数据仓库的创建工作。 本文详细分析了实现联机分析的各种方法,针对不同的使用者的差异情况,实现了对税金主题的联机查询和分析。 然后在简要介绍关联规则数据挖掘的基础上,提出了维间关联规则挖掘在税务系统中实现的具体思想,通过对Apriori 算法的修改,提出了改进的维间关联规则挖掘算法并在税务系统中应用,选取了几个有代表性的维进行了维间关联规则挖掘的试验,本方法同样适合对其它维间的关联挖掘。 最后本文提出了一个系统实现的架构。本文所研究的内容在税务系统的数据仓库创建工作和OLAP 的分析工作中已经得到了应用,关联规则挖掘方面的工作为税务系统数据挖掘的进一步应用建立了基础。对其它领域的类似应用也有一定的参考和指导意义。
其他文献
三维地震数据场的传统解释方法是用剖面及水平切片显示二维图像,具有很大的局限性,很早以前人们就指出三维数据三维解释的方向。科学计算可视化是实现三维数据三维解释的主要
高速发展的DSP技术为语音信号处理提供强有力的工具,使得实时实现各种各样的复杂算法成为可能。针对不同的应用,国际标准组织制定了一系列的语音压缩编码标准。其中,G.729A是
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个富有挑战性的课题,是新一代计算机的三大突破口之一,正受到世界各国
在工业现场环境下将无线通信技术与Internet结合,为测控系统提供实时、可靠的远程数据传输服务,最为关键的问题是对TCP/IP协议进行实时性改进以及针对工业无线信道特征设计出
近年来,随着电子商务和计算机技术的发展,把智能计算技术和数据挖掘技术应用到电子商务,解决现有电子商务技术在个性化服务及商品信息推荐等方面的种种不足。目前的Web个性化服
本论文讨论了如何在P2P系统中通过发掘、利用资源特征,来实现基于内容的文本检索。 各类文本文件是P2P文件共享系统中共享文件的重要组成部分。作为知识的直接来源,文本文件
随着互联网的发展,计算机犯罪活动越来越猖獗,防火墙和IDS 在一定程度遏制了黑客入侵,但是高明的入侵者防不胜防,作为主动防御技术的计算机取证技术的出现弥补了传统网络安全
随着计算机技术的迅速发展,企业越来越依赖于计算机系统和网络技术,需要企业服务器为客户连续的提供服务。高可用性(HighAvailability,HA)越来越受到人们的重视。尤其近年来,全球
在本文中,我们对于基因表达谱数据的特点进行了研究,根据基因表达谱数据的特点提出了表达谱数据噪声过滤、数值规范化两个方法;然后对于k-means聚类方法在表达谱数据上的应用
量的与日俱增为人们带来了信息共享的快乐,同时也带来了“信息迷航”和“知识匮乏”等问题。人们希望快速地得到自己需要的并具有个性的信息。对搜索引擎的检索结果进行个性化