论文部分内容阅读
在“互联网+”大数据时代下,零售相关数据量累积到30T以上,在整个零售营销过程中,如何挖掘数据的潜在价值,占据着重要地位。因此,针对全国800多万零售户,本文抽样采集零售户的零售动销数据和其他相关信息,对数据进行存储、加工、处理和挖掘。在此基础上,构建多层次多维度用户画像模型,利用改进的FCM算法对用户画像进行聚类分析,结合改进的推荐算法,设计并实现零售信息个性化推荐系统,将本文提出的理论和技术应用在系统中,实现对零售信息的个性化推荐。具体研究内容如下:1)终端信息采集系统进行数据的采集。针对全国800多万零售户分布广、杂乱等问题,通过现场走访的方式采集零售户的零售动销数据,对巡点计划进行改进;针对数据采集区域出现重复采集的问题,在系统中引入百度API定位进行采集优化,提高采集效率和采集数据的质量。2)多途径市场感知信息与数据挖掘过程的分析。将终端信息采集系统、零售订单系统和其他业务系统数据进行整合,对整合后的大规模数据进行统一清洗、集成和转换,按数据的需求建立数据降维模型。引入Hadoop中的Spark分布式对海量数据进行处理、加工等操作,实现企业数据的体系架构,多个系统数据业务共享等。3)研究多层次多维度用户画像模型。针对零售信息按需分类建立用户画像指标体系,提出四维数组构建多层次多维度的用户画像模型,主模型分为零售基本维度子模型、零售领域维度子模型、零售营销维度子模型和商业社交维度子模型四部分。利用改进的FCM算法对多层次用户画像进行聚类划分。将本文改进FCM算法得到的群组用户画像和传统FCM算法、传统K-Means算法、改进K-Means算法进行比较,实验结果表明本文算法降低算法的平均迭代次数和平均消耗时间,MAE明显下降,准确率和召回率得到提升。4)基于多层次用户画像模型的推荐技术研究。在群组用户画像的基础上,针对协同过滤算法数据极度稀疏、相似度精度不高等问题,提出融合离散量和用户偏好对相似度进行修正,得到相似度计算矩阵。最终提出基于离散量和用户偏好相似度的协同过滤算法,为零售户进行个性化推荐。实验结果表明,该算法与其他算法进行比较,能有效缓解数据极度稀疏、相似度模糊、推送精度不高的问题。5)零售信息个性化推荐系统实现与结果分析。针对传统零售信息服务低下的情况,将本文提出的理论和研究方法应用在系统中,将最佳结果推送给用户。应用结果表明,本文提出的多层次用户画像和改进的推荐算法成效显著,能够提高终端数据采集的质量;应用到企业产品零售推荐信息中,在市、省、全国范围内进行服务,整体的销量趋势有所提升。结果表明增长率提升了4.46%,客户增加了18.21%,其中2、3类客户增加了五万左右。