论文部分内容阅读
保险行业出现至今,在国家经济发展体系中发挥了重要作用,在社会建设体系和政府管理体系中都有着无可替代的重要价值。保险行业得益于市场经济进程的逐渐深入,成为了国民经济体系中增长最迅速的行业之一。随着居民可支配收入的大幅提高、汽车售价的急速下降以及居民购买环境的逐步改善,中国的汽车市场不断扩大,汽车需求量及保有量都呈现了极速增长的趋势。财产保险中的第一大险种就是汽车保险。2019年,财产保险中所有保费收入的61.3%都是车险保费的收入。和其余的各类保险一样,只有保险公司在吸引新客户的同时也不忘时刻关注老客户的续保情况,才能使汽车保险占据更大的市场份额。因此,保险公司对车险续保情况的研究和预测是非常必要的。本文主要使用Logistic回归模型、决策树模型、随机森林模型对车险续保情况进行研究,这三种模型都是机器学习中的经典模型,在解决分类及预测问题上因操作简单、拟合效果好、预测结果正确率高而被广泛使用。本文首先对三种经典的机器学习模型进行了介绍,包括模型的定义、分布、参数估计、构建模型的步骤、算法等。然后,对本文使用的原始数据及数据处理方法进行说明,包括数据中所包含的信息、特征变量等,以及数据缺失值处理、数据分组、整合方法。最后本文建立了Logistic回归预测模型、决策树预测模型、随机森林预测模型,利用这三种预测模型分别对某保险公司的车险续保情况进行预测分析。对这三种模型的结果进行比较可得,三种模型的预测正确率分别为Logistic模型71.7%、决策树模型75.4%、随机森林模型80.4%,由此可以得出预测结果中随机森林模型的效果最好的结论。车险续保模型的研究有着重要的意义和广阔的应用前景,本文所使用的三种模型都有继续研究和改进的空间。