论文部分内容阅读
随着全球经济一体化程度的不断深入,越来越多的新兴企业和新产品进入市场,加剧了企业之间的竞争,而企业的竞争主要体现在客户的竞争上,企业进行客户竞争的同时将会带来客户的流失,且客户流失的代价是巨大的,因此客户流失是企业面临的一个重要问题。同时对于企业而言人力、物力、财力等资源是有限的,且客户价值是不同的,有限资源的合理化差异化分配也是企业急需解决的问题。因此,本文综合考虑客户流失和客户价值两个方面的问题,在客户细分的基础上进行客户流失预测研究。在仔细研读和分析了国内外关于客户价值、客户细分以及客户流失预测的研究成果之后,提出了本文的研究内容、研究方法及研究路线。本文数据来源于2016年“客户流失概率预测”的比赛,是携程网提供的酒店客户流失预测数据。首先,对数据进行预处理并通过特征工程构造衍生变量,经过处理的数据大小由原来的689945×51变为689945×83。其次,建立基于客户价值的客户细分模型。结合本文所选数据的特征,基于收入价值、成长价值、客户忠诚度和口碑效应4个方面构造了包含22个指标的客户终身价值评价体系,利用KMeans-聚类方法进行客户细分,细分出3个不同的客户群体,并利用主成分分析,综合分析每一个主成分对应的载荷正负和大小,筛选出代表价值的主成分,从而计算每一类客户群体在该主成分上的平均得分,并根据平均得分定量的将客户划分为高价值、中价值、低价值客户。最后,针对客户细分得到的高价值、中价值、低价值客户群体,分别构建客户流失预测模型。本文基于机器学习方法选取的训练模型有随机森林、XGBoost和LightGBM,通过准确率(Accuracy)、精确度(Precision)、召回率(Recall)、score-F1和AUC值评估模型。为了进一步验证客户细分后模型的预测效果,对比分析客户细分前后模型在评估指标上的表现情况,最终发现进行客户细分后,整体来看,综合考虑精确度和召回率的score-F1评估指标均有所提升,在一定程度上为进行客户流失预测和挽留提供了研究思路和方向。