论文部分内容阅读
随着经济以及信息技术的发展,数据挖掘技术在各个领域的应用也越来越广泛。作为经济和社会的一个重要成分,税收在国家财政收入中扮演着非常重要的角色。数据挖掘技术常被应用于研究税收预测问题。财政预算工作的开展以及税收计划的制定要以税收预测结果为参考依据,所以税收预测算法得到了税务行业研究人员的高度重视。如何利用少样本、多维度的税收数据进行高效的建模,是税收应用领域亟待解决的问题。本文提出了运用数据挖掘技术来预测税收收入的方法,为提高税收预测准确率做进一步的研究。首先,对历史税收数据集进行预处理,以期获得高质量的税收指标样本集。使用相关性分析和逐步回归分析方法对税收指标进行降维,求解不同税种的关键指标因子。针对默认参数情况下基于支持向量机的税收预测算法预测精度不佳的问题,提出应用网格搜索法对支持向量机算法中参数进行改进的方法,从而实现优化的支持向量机税收预测算法。其次,针对预测算法的验证性和预测性问题展开研究,提出一种优化组合税收预测算法的方法。首先研究基于灰色序列的GM(1,1)税收预测算法和基于时间序列的ARIMA税收预测算法,分别求解两个算法的税收预测值,将上述预测结果以及真实税收数据集组成组合算法的实验样本集。然后使用多层次网格搜索法求解使预测误差最小的权重系数,实现优化的组合税收预测算法,达到提高预测精度和优化预测结果的目的。最后,利用真实税收数据分别对优化的支持向量机税收预测算法和改进的组合预测算法进行实验验证。仿真结果表明,两个算法的预测精度均比未改进之前高,验证了算法的有效性。