论文部分内容阅读
本文主要介绍了基于数据分析与挖掘技术的税收执法管理系统的设计与实现。随着近十年的数据积累,税务行业已经在全国范围内形成了一大批丰富而全面的业务数据。设计和开发税收执法管理系统,就是为了利用这些丰富的税务数据,运用数据分析与挖掘技术,去规范税收执法过程、自动执行考核、发现和纠正执法问题,最终预防职务犯罪。为此,本文运用了数据仓库技术、OLAP技术、BI技术,从数据抽取、集成,到建立数据仓库、OLAP分析与展现,建立了一整套完整的DW/BI系统。通过这一系列设计与开发建立起来的税收执法管理系统,通过自动考核与建立疑点库,在全国税务系统中建立起了一整套监督机制,为国家的税收建设发挥着应有的作用。文中详细列举了一些示例,完整阐述了整个分析与创建过程。然而,在构建整个DW/BI系统的过程中,依然有许多的难题需要解决,为此本文尝试运用数据挖掘技术。本系统对数据分析的准确性要求非常高,要达到90%以上。但由于数据采集自第三方系统,对第三方系统业务逻辑与数据库设计的许多细节都不甚清楚,特别是第三方业务系统还在每年升级维护。正因为以上原因,造成数据分析不准确,误考核情况频频发生。为此,本文尝试采用分类算法中的决策树算法,运用数据本身的规律侦测取数路径,采用迭代的方式逐步提高分析准确率,并随时监控第三方系统业务变化对本系统的影响。此外,本文还运用频繁模式与关联分析,来分析各种不同数据间的内在联系,从而设计开发疑点信息库,去发现和追踪隐匿其间的职务犯罪行为,震慑犯罪份子,进而达到预防职务犯罪的目的。