论文部分内容阅读
科技的飞速发展,使得企业的市场竞争也变得日益激烈,作为传统行业的印刷设备制造企业,其售后维修服务也成为了企业的重要竞争能力之一。如何从大量历史维修数据中挖掘出有用信息并直观的展示出来成为一个重要的课题,也是印刷设备制造商的一个迫切愿望。本文利用陕西北人印刷机械有限责任公司的售后数据记录,通过统计分析与挖掘分析,对售后数据中的客户数据、产品数据以及维修数据展开不同层次的分析,分析结果为企业在售后服务方面提供指导意见。数据分析内容包括数据预处理、数据分析、数据存储以及平台可视化展现四个方面。针对现有售后数据种类繁多、脏数据多、文字性描述多等问题,先对其进行数据清洗转换等预处理操作。然后构建算法分析的数据模型,统计分析研究客户区域特性、客户购买力、产品销售与维修情况、维修服务效率、故障率等问题。挖掘分析利用大数据Hadoop处理平台,实现K-means算法对客户的并行化聚类分析和协同过滤算法对产品-维修配件的并行化推荐分析。最后设计数据存储方式,以关系型数据库SQL Server与Hadoop上的Hive数据仓库相结合的存储方式,来分别满足业务数据的操作和数据分析操作。Hive数据仓库的建立,为以后在Hadoop平台展开更多的分析打下基础。基于以上分析与研究结果,搭建陕西北人云中心后台管理平台系统,系统共分为客户管理、产品管理、售后管理以及数据分析四个模块。利用数据可视化技术将分析结果进行多样化地展示,更直观地获取对企业销售、生产、售后等各个环节有价值的数据信息,提高软包印刷设备企业的售后数据分析技术水平。