论文部分内容阅读
随着数据挖掘技术的不断发展与成熟,专家学者试图将其应用于求解各行业问题,该技术的主要操作模式通过对已有信息数据的分析研究建立模型,并根据模型找出隐藏在这些海量数据中的业务规则。显然电信行业是一个存在海量数据信息的行业,然而随着电信市场日趋饱和,竞争也越来越激烈,各企业不可避免的面临客户大量流失的困境。为了保持企业的竞争力,各运营商不得不耗费高额成本来获取新客户。然而企业获取新客户所需的成本是维系老客户的五至十倍,且忠诚度高的老客户对企业的利润贡献度要远远高于新客户。因此如何及时发现忠诚度低的客户,并对其采取相应的维系措施是当前电信亟需解决的问题,所以运用数据挖掘技术找出影响电信客户忠诚度的关键因素并建立对应预测模型显得尤为重要。本文的研究目的就是应用数据挖掘技术发现可描述客户忠诚度的特征,并由此建立客户忠诚度预测模型,根据模型可有效预测各电信客户的忠诚度高低,并给出相应名单,由此企业决策者可根据客户忠诚度制定相应的维系挽留政策。具体而言,本文的主要工作可分为如下几部分:(1)数据挖掘算法的确定,目前数据挖掘领域存在许多类型的算法,如遗传算法、贝叶斯网络算法以及决策树算法等,每种类型的算法均有不同的适应领域,考虑到贝叶斯网络算法存在具备强大的处理存在数据缺失情况的问题的能力以及其能将先验知识和训练集数据进行有效结合的特点,本文选择利用贝叶斯网络方法用于建立预测模型。(2)客户忠诚度预测模型的建立,整个模型的建立过程分为如下五个步骤,即商业目的确定、数据理解、数据准备、模型建立以及模型评价。每个阶段负责不同的任务,商业目的确定阶段的任务在于预测各个客户的忠诚度,并提供对应客户名单以供企业管理者进行客户关系管理操作;数据理解阶段的任务在于熟悉已有客户资料,并对这些资料进行归类,本文包含的客户资料可分为客户注册资料、客户消费资料、客户通话记录资料以及衍生数据四类。数据准备阶段的任务在于从已有的客户数据中找出对研究客户忠诚度有价值的信息,并对这些数据所具备的属性进行分析研究,找出影响客户忠诚度的关键因素,然后对这些因素取值进行处理以使其满足贝叶斯网络方法的建模要求。该过程主要包含如下四个阶段,依次为数据选择、数据清洗、属性选择以及值域转换。模型建立阶段的任务在于确定客户忠诚度预测模型的网络结构,并确定网络中各结点的条件概率分布表。模型评价阶段的任务在于量化模型的效果,检验模型的有效性。经过上述五个步骤客户忠诚度预测模型就已建立完成。(3)客户忠诚度预测分析系统的设计与实现,为了建立一个满足用户需求的系统,首先对客户忠诚度预测分析系统进行了详细的需求分析,了解了用户对系统的性能需求和功能需求,在此基础上对系统进行了详细的功能设计,并对系统中的重点功能进行了介绍。本系统的开发技术为JSP,数据库为SQL Server2000,通过JDBC技术连接系统数据库。经过测试表明系统的功能达到了当初设计的目标,可以应用到实际的客户忠诚度预测中。