论文部分内容阅读
全球经济一体化、计算机科技学技术、互联网及相关领域融合和快速发展,云平台下大规模信息共享和发掘,已经改变传统意义上企业发展战略模式和营销战术上实现方式。随着企业可持续健康发展,尤其是基于客户量行业,在大信息量的数据库中,对于信息删选和挖掘,已经成为计算机软件科学人员研究一个重要热点问题。因此本文依据智能数据挖掘技术基础,建立互关联算法交叉销售、决策树客户响应、聚类算法三类电信用户分析模型,并对相应理论和实践工程方面进行研究。主要完成以下工作:(1)对数据库挖掘技术基本概念进行深入分析,结合数据挖掘流程和电信行业应用领域常用数据挖掘技术,对数据挖掘技术当前的研究方向和发展趋势进行总结。(2)建立电信客户交叉销售模型,分析电信产品增值业务内在关系。根据业务所对应的事务数据库特点,分析后选用FP-growth算法。又考虑到电信领域数据量大的特点,构造一个基于内存的FP-tree是不现实的,提出基于PL/SQL的FP-Growth算法,即通过将FP-growth算法融入到关系数据库系统中,利用数据库管理系统自身强大查询功能,从存储FP-tree数据库表中查找出所有频繁模式集,减少数据传输和转换时间,并解决数据量大的问题。然后利用置信度,判断产生关联规则,有效找出电信增值业务交叉销售组合结果,指导决策者采取行之有效策略。(3)建立基于决策树的客户响应模型。C省电信公司拥有多种业务,提取出每种业务开通较多客户群体主要特征,反过来就可以向具有相似特征准客户推荐该业务。基于决策树客户相应模型建立,是分析开通“音乐丽影”大多数用户自然属性特征和消费行为特征,然后根据这些特征,进行有针对性推销,这样可以大大减少公司拓宽该项业务市场成本。依据SPRINT算法特点和优势,能够实现决策树一棵两叉效果,提高数据库决策树建立时间和相关分类速度,C省电信公司数据库数据挖掘技术SPRINT算法用户响应模型,经过反复实验,确定了合理的阈值,提取数据库数据分类原则,实现C省电信公司使用“音乐丽影”用户特征。并对基于SPRINT算法模型进行与C4.5算法比较,模型评价结果表明,SPRINT算法与C4.5算法对比可知,其准确度值略小,但是具有相对较高的数据库数据统计学覆盖率。在C省电信公司信息的业务背景下,对于客户响应预测问题而言,对开通该业务客户的识别能力要求较高,也就是说模型对覆盖率比对精确率有更高要求。所以说从预测效果相对而言,SPRINT算法取得较好预测效果。(4)基于聚类算法数据库用户细分模型建立。商业目的需求是指以用户多样需求为导向,具有商业价值目标数据库数据挖掘,本文对于电信企业数据库商业目标是,建立企业用户进行相关细分类。首先,对于数据分析列表设计、数据库数据整理和按格式进行数据转换;其次,应用优化K-Means算法进行数据库用户细分模型建立。最后,通过实际程序仿真和与C省电信业务人员的实际沟通,确定数据库数据挖掘细分类别数值为4,而且消费细分特征具有很好明显性,数据库数据信息类与类之间差异性明显,因此建立数据库数据挖掘聚类算法模型是可行的。基于聚类算法的数据库细分模型,具有相对稳定的针对性,有利于电信产品和服务市场的拓展,形成市场核心竞争优势。