论文部分内容阅读
随着保险市场的逐步商业化,特别是在加入WTO后,我国的保险业面临着更加巨大的挑战。客户是保险公司生存和发展的根基,然而激烈的市场竞争使得越来越多的保险公司面临着严峻的客户流失问题。在这种形势下,防止客户流失是保险公司提高竞争力的关键。
本文首先综述了数据挖掘在保险领域的研究现状,指出目前国内对客户流失状况深入研究较少;接着结合客户关系管理理论以及数据挖掘技术,构建了基于数据挖掘的保险客户流失模型。模型的核心部分是主成分分析和决策树分类,本文对这两种方法进行详细的介绍。主成分分析是一种常用的特征提取方法,主要用于模型数据的预处理。决策树方法是一种归纳分类算法,它能很好地与大型数据库结合,并能处理多种数据类型,且其结果也容易被人理解。决策树方法已被成功应用于许多分类问题,但应用于保险的客户流失研究在国内甚少。
本文最后抽取某寿险公司2002年的客户数据,对客户流失模型进行实证分析,具体论证如何建立模型,对包括数据准备、模型构建以及模型评价在内的整个建模过程进行了详细分析和研究。模型的分类模式容易转化成分类规则,并结合商业经验给出规则解释,所发现的知识也具有一定的合理性和参考价值,对保险公司的工作起到一定的指导作用。
本文的主要贡献在于应用数据挖掘技术进行保险客户流失研究,构建一种新的客户流失模型。本模型和电信、零售行业的客户流失模型有所区别。首先,本模型增加了客户价值因素的考虑,定义了客户流失的三种类型,着重分析其行为特征。其次,保险数据具有属性多、更新快等特点。如果把所有的属性都用于组建模型的挖掘宽表,那么将会大大增加信息的存储量和处理量。对于客户流失分析这一特定的挖掘任务,模型采用主成分分析法提取样本空间的特征向量,对属性进行归约,更好地把握了客户特征和流失的关系。