论文部分内容阅读
本文针对现有税务稽查选案存在的企业财务数据量大、选案方法对样本可靠程度依赖性强、对选案结果的解释性差和选案指标适用性差等问题,以提供税务稽查部门充分的稽查信息和辅助选案为目标,将数据挖掘中的聚类算法和统计分析方法引入到稽查选案系统中,在相似性划分的基础上对稽查选案对象进行纳税评估,从而得到稽查对象。本文研究了聚类的原理及算法,结合统计方法,设计了基于指标判别的稽查选案过程,并为税务稽查部门开发了基于这种方法的稽查选案系统。本文所做的主要工作如下:(1)从现有稽查选案存在的问题出发,分析稽查选案问题和稽查对象的信息特点,提出聚类方法在对企业纳税评估前进行分类的方法,并为稽查选案系统的建立提供了依据。同时根据稽查选案对象的属性特征,分析了选案问题的聚类目标,研究了聚类方法的数据类型,相似度度量方法以及面向稽查选案对象的聚类算法:将企业的财务属性转化为数据矩阵,通过对企业各种类型数据地相似度度量,实现了对企业相似性的划分,为基于多指标的判别提供了算法依据。(2)通过建立合理的稽查选案的判别指标体系,对聚类后的每一类企业进行指标计算;利用最大熵判别法剔除异常点对阈值的影响,再用求置信区间的方法得到阈值,实现对各指标的判断并甄别出异常指标的个数,选出需要重点进行稽查的目标对象,实现整个税务稽查选案的过程。(3)利用系统工程的思想,采用结构化的系统设计方法,设计并实现了基于聚类和统计方法的税务稽查选案系统,验证了基于聚类和统计方法的稽查选案方法,取得了良好的效果。本文提出的基于聚类的对稽查对象先分类后判别的方法在基于多指标判别的稽查选案中具有一定的理论意义和使用价值。同时,系统的开发为税务稽查人员提供了可视化的操作环境,并使本文提出的稽查选案方法的应用在稽查选案中成为了可能,丰富了稽查选案的方法,提高了稽查选案的准确率和效率,促进计算机辅助选案系统的发展与应用。