基于海量零售数据用户画像的推荐算法研究

来源 :浙江理工大学 | 被引量 : 3次 | 上传用户:aujnqejbrob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在“互联网+”大数据时代下,零售相关数据量累积到30T以上,在整个零售营销过程中,如何挖掘数据的潜在价值,占据着重要地位。因此,针对全国800多万零售户,本文抽样采集零售户的零售动销数据和其他相关信息,对数据进行存储、加工、处理和挖掘。在此基础上,构建多层次多维度用户画像模型,利用改进的FCM算法对用户画像进行聚类分析,结合改进的推荐算法,设计并实现零售信息个性化推荐系统,将本文提出的理论和技术应用在系统中,实现对零售信息的个性化推荐。具体研究内容如下:1)终端信息采集系统进行数据的采集。针对全国800多万零售户分布广、杂乱等问题,通过现场走访的方式采集零售户的零售动销数据,对巡点计划进行改进;针对数据采集区域出现重复采集的问题,在系统中引入百度API定位进行采集优化,提高采集效率和采集数据的质量。2)多途径市场感知信息与数据挖掘过程的分析。将终端信息采集系统、零售订单系统和其他业务系统数据进行整合,对整合后的大规模数据进行统一清洗、集成和转换,按数据的需求建立数据降维模型。引入Hadoop中的Spark分布式对海量数据进行处理、加工等操作,实现企业数据的体系架构,多个系统数据业务共享等。3)研究多层次多维度用户画像模型。针对零售信息按需分类建立用户画像指标体系,提出四维数组构建多层次多维度的用户画像模型,主模型分为零售基本维度子模型、零售领域维度子模型、零售营销维度子模型和商业社交维度子模型四部分。利用改进的FCM算法对多层次用户画像进行聚类划分。将本文改进FCM算法得到的群组用户画像和传统FCM算法、传统K-Means算法、改进K-Means算法进行比较,实验结果表明本文算法降低算法的平均迭代次数和平均消耗时间,MAE明显下降,准确率和召回率得到提升。4)基于多层次用户画像模型的推荐技术研究。在群组用户画像的基础上,针对协同过滤算法数据极度稀疏、相似度精度不高等问题,提出融合离散量和用户偏好对相似度进行修正,得到相似度计算矩阵。最终提出基于离散量和用户偏好相似度的协同过滤算法,为零售户进行个性化推荐。实验结果表明,该算法与其他算法进行比较,能有效缓解数据极度稀疏、相似度模糊、推送精度不高的问题。5)零售信息个性化推荐系统实现与结果分析。针对传统零售信息服务低下的情况,将本文提出的理论和研究方法应用在系统中,将最佳结果推送给用户。应用结果表明,本文提出的多层次用户画像和改进的推荐算法成效显著,能够提高终端数据采集的质量;应用到企业产品零售推荐信息中,在市、省、全国范围内进行服务,整体的销量趋势有所提升。结果表明增长率提升了4.46%,客户增加了18.21%,其中2、3类客户增加了五万左右。
其他文献
目的研究分析腹腔镜胆囊切除术对胆结石的临床疗效及安全性。方法选择100例胆结石患者随机分为两组。对照组50例患者行以传统开腹手术进行治疗;实验组50例患者行以腹腔镜胆囊
宋代的包公本为一白面书生。宋元话本及元杂剧将包公塑造为昼审阳间,夜断阴世的判官形象,随之包公面相逐渐变得黑丑。在晚清民国的京剧中,包公面相定型,面庞黝黑,额有月牙。包公面
目的利用响应面法(RSM)优化半枝莲总黄酮的超声提取工艺。方法在单因素试验的基础上,采用Box-Behnken中心组合试验设计法,考察乙醇浓度、提取温度、超声功率对半枝莲总黄酮提
<正>临床营养已经被公认为21世纪十大医学进展之一,它被广泛应用于临床各个学科的疾病治疗过程中。通过为病人提供合理有效的营养支持干预,以提高治愈率、降低死亡率、减少并
被誉为诗坛“常青树”的郑敏是当今创作力最为旺盛的诗人之一,她的少年时期正是20年代新诗的发源开创时期。郑敏在西南联大学习期间,开始了他的诗歌创作生涯。她与穆旦、杜运燮
上个世纪八十年代末九十年代初一系列中国诗人的死亡昭示着什么?而海子的自杀更是其中代表。《面朝大海,春暖花开》则向我们昭示着在这个在这个贫乏的年代,诗人何为?
<正>2018年,我国公共法律服务平台建设迈出新步伐。目前,全国已建成县(市、区)公共法律服务中心2917个、乡镇(街道)公共法律服务工作站39380个,覆盖率分别达到99.97%和96.79%