基于RBM的音乐网站会员流失预测及内容推荐方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对影音娱乐的需求增大使得音乐行业蓬勃发展,当前各种音乐平台数量激增。但是目前各类音乐产品形态及内容同质化严重,竞争激烈导致会员流失情况加剧,且音乐行业盈利主要依赖会员收费,即使少量的会员流失也会造成巨大经济损失。综上所述,针对性预测音乐会员流失并提前采取挽留措施十分必要,这项研究举措将可以帮助音乐平台更好维系平台用户生态从而带来更多利润。本文主要切入音乐行业领域,选取音乐流媒体网站的会员行为数据作为数据集进行会员流失预测及流失后通过个性化推荐进行用户召回策略研究。主要搭建了两个用户模型,第一个是会员流失预测模型,第二个是音乐内容推荐模型。两个模型互补形成业务上的闭环,在得到流失预警后及时采取挽留手段在极大程度上防止了核心用户流失,同时通过内容推荐增加了用户粘性。本文主要研究如下:(1)针对流失会员和未流失会员之间存在高度的行为相似性,传统分类模型难以有效甄别的问题,设计受限玻尔兹曼机模型(Restricted Boltzmann machine,RBM)对会员用户进行特征提取,搭建极度梯度提升模型(Extreme Gradient Boosting,XGBoost)学习会员行为特征,将两者模型进行结合提出RBM-XGBoost组合预测模型,进行会员流失预测。经实验证明,RBM-XGBoost组合预测模型在预测精度和泛化能力上优于传统分类模型。(2)麻雀搜索算法(Sparrow Search Algorithm,SSA)作为新兴群体智能优化算法,寻优能力突出,适用于超参数寻优等问题,但仍存在局限性。针对SSA在迭代后期容易陷入局部最优值而早熟的问题,提出改进的麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)。该算法通过PWLCM映射初始化种群,使初始种群分布更加均匀;在迭代过程中陷入局部最优值时启动t分布变异结合高斯变异的混合变异策略,增加种群多样性跳出局部最优。经实验验证表明,改进的麻雀搜索算法ISSA在求解精度和稳定性上更加突出。(3)针对XGBoost模型超参数众多,难以凭借人工经验选取且传统参数搜索方法耗时长,容易产生组合爆炸的问题,提出RBM-ISSA-XGBoost模型,使用改进的麻雀搜索算法ISSA来对XGBoost模型进行超参数寻优。实验证明参数寻优后的预测模型预测精度和收敛能力得到有效提升。(4)预测出有流失倾向的会员后,根据会员的流失概率划分为不同挽留难度的群体,针对性提出挽留建议。针对较易挽留的会员群体,通过音乐推荐作为挽留手段进行流失召回,设计混合推荐模型,将基于RBM和基于用户的协同过滤模型的预测结果通过线性加权进行融合,对比单一推荐模型可以实现更精准推荐。
其他文献
目前,地铁明挖车站的修建方法多为在基坑内现浇结构,此法受施工环境影响较大,且施工速度慢,对城市环境影响较大。近年来,一种配备榫槽注浆式接头的全预制拼装地铁车站结构被提出,并在长春地铁建设中使用,有效解决了上述问题。此前,多位学者已经对榫槽注浆式接头构件的静力学性能进行了系统的理论及实验研究,但对该接头构件动力性能的研究还非常有限。基于此背景,本文以榫槽注浆式预制拼装地铁车站结构为研究对象,从该接头
在对城市地下空间的开发使用中,大量地铁车站不可避免地修建在地层复杂的场地之中,当场地中存在较大性质差异的软硬不均的地层时,车站受力形式复杂,目前对非均匀地层中地铁车站的地震响应有一些研究,但有关这种非均匀性对车站内力、变形,特别是破坏影响的了解还相对不足。本文通过数值模拟分析,探讨软硬不均匀地层中地铁车站的地震响应特性和破坏模式。主要工作和成果如下:(1)针对不同地层组合的软硬不均匀场地,参考实际
学位
作为后续步态和行为识别的基础工作,行人的轨迹与骨架信息提取一直是计算机视觉领域的重要热点话题。近年来视频监控在人流追踪、疫情安检等公共场合下发挥了重大作用,然而监控场景下的信息提取精度以及智能处理水平还有待提高,传统的跟踪与骨架提取算法普遍受到差异化的监控环境与监测噪声的影响。围绕着这一难题,本文基于视频监控场景对行人跟踪与骨架提取算法进行研究。本文所做的研究工作主要如下:1.为了解决基本的颜色粒
随着城市规模不断扩大和人口激增,地铁建设已成为城市发展的重要方向之一。盾构机是目前最先进的隧道掘进设备,有效改善了施工人员的作业环境,具有机械化程度高、安全可靠等优点,在地下工程施工中广泛使用。盘形滚刀因其优秀的破岩性能,被广泛地用作盾构和TBM的破岩刀具。然而,在实际工程中,滚刀磨损是盾构施工最常见的损耗之一,严重影响施工效率。本论文属于科技部“973”课题“复杂条件大直径盾构长距离安全掘进理论
近年来,我国高速铁路飞速发展,保证列车在运营过程中的安全和稳定显得尤为重要。轴箱轴承作为高速列车走行部上的关键部件,其性能的正常与否直接关系到列车运行的安全与稳定。当前我国高速列车主要通过车载轴温检测系统监测轴箱轴承的运行状态,并基于固定的轴温阈值报警,但是该系统存在漏报率和误报率高的问题,并且该系统在历史运行过程中采集到的大量数据没有得到充分利用。针对以上问题,本文分析了高速列车轴箱轴承的温升机
在全球化背景下,出境旅游一直是社会各界讨论的热点话题之一,然而人们较多关注出境旅游带来的积极影响,却忽略了旅游业本身的脆弱性。出境旅游易受突发公共卫生事件和自然灾害等危机事件的影响。2020年初爆发的新冠肺炎疫情使全球旅游业的发展一度陷入停滞状态,出境旅游人数也大幅缩减,因此研究新冠疫情影响下旅客的出境旅游行为,对旅游地政府部门制定相关政策刺激出游具有重要意义。本文的主要研究内容如下:首先,结合国
随着大数据时代的到来,人们逐渐面临各式各样的网络安全问题,而恶意URL(Uniform Resource Locator)作为Web攻击的媒介,渐渐威胁着用户的信息安全。传统的恶意网页检测手段如黑名单检测、签名匹配方法正逐步暴露缺陷,且恶意网页的检测工作面临以下挑战:特征覆盖不足以及特征选取复杂,恶意URL分词及上下文信息等特征的丢失,实际检测环境中正常恶意类别样本分布不均衡。因此针对以上挑战,本
近年来,随着工业化进程的不断加快,空气污染问题愈发严重,已经成为各个国家亟待解决的问题。各国政府纷纷采取应对措施,除了从源头上减少污染气体排放之外,许多大城市纷纷建立了空气质量观测站点来进行实时的监测。为了预警极端雾霾天气,指导市民的室外活动与出行规划,对空气质量进行预测亦十分重要。然而目前空气质量预测问题存在着多源数据交叉干扰,误差累积等问题,此外,人们最关心的长期空气质量预测以及极端天气预警仍
近年来,随着高铁逐渐成为地域沟通和人才流动的主要交通方式,高速铁路场景成为LTE、5G等无线通信系统的重要研究场景之一。由于高速移动无线信道具有快时变、非平稳等特性,给无线传输技术如信道估计与预测、信号检测与解调、信道均衡、信道译码等带来巨大的挑战,导致接收机性能恶化;另一方面,相比公网场景,不同通信模块之间在高速铁路场景下的联合性能表现是次优的,并且需要支持不同的通信制式,大大增加了接收机的适应