论文部分内容阅读
随着体育消费的需求多元化,体育服务业之间的竞争日益激烈。体育消费者流失是一种理性消费的选择,它的发生具有非常明显的因果关系,这种因果关系往往体现在过去的体育消费记录中,因此挖掘体育消费者过去的体育消费记录是分析体育消费者流失行为的不可或缺的一个过程。体育消费者流失行为在先前体育消费行为研究个案中并不多见,但因体育消费者流失对行业所造成的负面作用却是行业发展中相当棘手的问题。降低体育消费者流失率,不但是体育产业持续发展的关键,也是提升城市居民体育消费水平、提高生活质量的重要途径。体育消费者流失分析是通过对以往流失体育消费者的历史数据进行分析,找出潜在体育消费者的特征,及时采取相应措施,减少体育消费者流失的发生。本研究认为体育消费者流失是指体育消费者不再重复购买商品,或终止原先使用的体育服务。对于消费者流失预测问题的流失模型建立有两种解决方案:第一种思路是把流失看作二元结局,构建二元流失模型,预测哪些消费者将会离去,哪些消费者将会留下来;第二种思路是设法评估消费者的剩余生存期,构建生存时间流失模型,预测消费者可能保持多长时间。本研究所涉及的核心数据为西安市城镇地区居民体育消费数据,包括参与型体育消费、实物型体育消费以及观赏型体育消费数据。依据《城镇居民入户调查手册》中的城市居民个人消费调查方案进行数据收集,采集2016年1月-12月的数据,获取12个月的消费者数据,全部样本为1409个,共获得144238条数据,数据包括消费者的人口学特征和消费行为特征。本研究分别运用人工神经网路、决策树、逻辑回归、支持向量机、朴素贝叶斯等二元分类工具建立体育消费者流失模型,并依据模型的预测命中率、覆盖率、准确率和提升系数等方面的性能,优选出C5决策树算法构建体育消费者流失预测模型。二元分类器结果显示,C5决策树模型、贝叶斯网络模型、C&R决策树模型、CHAD决策树模型、SVM模型、神经网络模型、QUEST决策树模型的最大利润率分别810、455、460、325、265、205和143.2;C5决策树模型、贝叶斯网络模型、C&R决策树模型、CHAD决策树模型、SVM模型、神经网络模型、QUEST决策树模型的最大利润发生率分别为54%、31%、47%、31%、31%、30%和51%;C5决策树模型、贝叶斯网络模型、C&R决策树模型、CHAD决策树模型、SVM模型、神经网络模型、QUEST决策树模型的总体精确性分别为84.9%、66.5%、72.2%、67.2%、60.4%、61.2%、60.6%。C5决策树模型、贝叶斯网络模型、C&R决策树模型、CHAD决策树模型、SVM模型、神经网络模型、QUEST决策树模型的曲线下方区域的比例分别为0.924、0.792、0.748、0.744、0.676、0.641、0.633。综上所述,C5决策树模型最大利润率、总体正确率以及曲线下方区域比例最高,优于其他6个模型.因此,最终采用解释性强、正确率较高的C5.0决策树方法构建最终模型。研究结果表明经济基础是体育消费者是否流失的重要因素,家庭经济基础较好的体育消费者流失的可能较低。服务性消费支出较多且家庭成员中有相对稳定收入的离退休体育消费者流失的可能性较低;家庭中没有离退休人员,说明家庭成员年龄相对较低,这一类体育消费者流失的可能较小。食品消费支出中干鲜瓜果类及制品、肉禽蛋水产品类和糕点消费金额较大的体育消费者流失的可能性低。反之,体育消费者流失的可能性较高。衣、食、住、行等生存型消费支出仍然是目前城镇居民最主要的支出,作为发展与享受型消费的体育消费支出在城镇居民的日常消费支出中所占比例仍然处于较低水平;城镇居民的体育消费项目呈现出多元化特征,但还处于由实物型体育消费向参与型体育消费和观赏型体育消费过渡的阶段。