基于用户兴趣挖掘的个性化推荐方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:bindao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网应用的数量出现爆发式增长,这极大地丰富了互联网的内容,但同时也带来了严重的信息过载问题,用户很难在互联网的海量信息中准确定位自己感兴趣的内容。个性化推荐系统能够按照用户个人的兴趣喜好从大量繁杂的互联网信息中过滤出用户感兴趣的内容,在很大程度上解决了信息过载的问题,从而成为了互联网时代必不可少的技术应用之一,并受到了企业和学者的广泛关注。在应用过程中,个性化推荐系统的设计面临诸多挑战,例如用户兴趣建模、历史信息时效性建模、冷启动用户的推荐、数据稀疏性、推荐结果可解释性等。为了应对这些挑战,国内外的研究人员已经提出了大量的解决方案。然而,仅仅从技术角度出发设计用户兴趣建模算法并不能真实地反映用户兴趣的一般发展规律。个性化推荐系统基于用户兴趣预测用户是否喜欢某样产品,用户兴趣的模型质量将直接影响推荐系统的推荐性能。兴趣是人的固有特征,社会心理学的研究表明,人的兴趣具有特定的发展规律。在本文中,我们从用户兴趣的发展规律出发,对用户兴趣的动态发展过程进行建模,主要解决个性化推荐系统中用户兴趣建模、兴趣转移预测和冷启动用户推荐等问题。本文的主要工作和贡献如下:1.基于动态兴趣模型的推荐方法用户在与系统交互过程中产生了大量的用户交互日志,其中蕴含了丰富的用户兴趣信息。从用户交互日志中建模用户兴趣所要考虑的首要因素是信息的时效性。当前的研究工作往往使用单调递减函数建模用户信息时效性,即认为用户越近期的行为,越能反应用户的兴趣状况。然而,我们通过先前的研究发现,每位用户都有着个性化的兴趣模式,用户可以同时保持多种兴趣,并且兴趣的强度是动态变化的。用户兴趣的发展过程可以分为兴趣上升与兴趣下降两个阶段。基于上述发现,我们提出了SimIUC推荐框架,它可以识别用户个性化的兴趣模式,并使用倒U曲线建模用户兴趣的动态发展过程。特别地,不同于现有的基于单调递减函数建模用户兴趣的研究,SimIUC基于用户的倒U兴趣模型预测用户兴趣的发展趋势并做出推荐。我们在MovieLens和Netflix数据集上做了大量实验,实验结果表明,基于倒U兴趣模型的SimIUC推荐框架的性能要优于目前的主流推荐算法,倒U兴趣模型可以有效地提高推荐系统的性能。2.基于兴趣转移模型的序列推荐方法通过对用户兴趣的研究我们发现,用户在与系统的交互过程中,用户兴趣在短期内保持稳定,但长期来看,用户的兴趣会发生显著的变化,并且用户兴趣的保持时间和变化频率是个性化的。基于上述情况,为了能够建模用户兴趣的转移过程,我们提出了一种新的个性化推荐框架HOMMIT。HOMMIT可以识别用户兴趣并且使用改进的高阶马尔科夫模型建模用户兴趣的动态转移过程,进而预测用户兴趣的转移趋势并做出推荐。我们在两个真实数据集上进行了大量实验,比较了HOMMIT框架的多种实现方式之间的性能差异,并且将HOMMIT框架与现有流行算法进行了性能比较。实验结果表明,HOMMIT在序列推荐问题上有着优于其它参比算法的推荐准确率,证明了在兴趣建模时考虑用户兴趣转移的必要性。3.基于情感评论模式映射的跨域推荐方法冷启动问题和数据稀疏性问题是个性化推荐系统面临的两大挑战。跨域推荐算法可以从数据量丰富的源产品域挖掘用户兴趣特征,并将其迁移至数据稀疏的目标产品域,有效地缓解了目标产品域中数据稀疏问题,解决了目标产品域中冷启动用户的产品推荐问题。但是现有的跨域推荐算法多数是从评分、标签和文本信息中挖掘用户兴趣特征,而没有对用户评论中的情感特征进行有效利用。本文中我们提出了一种基于情感评论模式映射的跨域推荐算法SRPM。SRPM能够识别用户评论的情感倾向,并将用户的情感评论模式映射至目标产品域,解决目标产品域中的冷启动用户的推荐问题。我们在含有多个产品域的亚马逊数据集上对算法性能进行验证。实验结果表明,SRPM的跨域推荐性能优于参比的流行跨域推荐算法。4.情感感知的深度学习跨域推荐方法从数据量丰富的产品域进行知识迁移是解决数据稀疏性和冷启动问题的有效方式。能否准确地从源产品域提取用户特征并进行迁移,是提高跨域推荐算法性能的关键。现有的基于用户评论的跨域推荐算法没有有效地利用用户评论中所蕴含的用户情感信息,尤其是在知识迁移中易被削弱或被错误迁移的负向消极的情感信息。本文中我们提出了基于情感感知的评论特征迁移的跨域推荐算法SARFM。SARFM利用深度学习模型SDAE建模用户的情感感知的评论特征SARF,并将SARF迁移至目标产品域,解决数据稀疏性和冷启动问题。我们在亚马逊跨域数据集上比较了SARFM的多种实现方式的性能。实验结果表明基于深度学习模型的SARFM能够更有效地提取用户评论中的情感特征,能够取得优于相关跨域推荐算法的性能。
其他文献
根据我国各地区公共图书馆发展不平衡的现状,对31个省市自治区公共图书馆的机构数、总藏量等七项主要统计数据进行了主成分分析和聚类分析。依聚类分析图,把各公共图书馆划分为
研究背景帕金森病(Parkinson’s disease, PD)是一种常见于中老年人的进行性的中枢神经系统变性疾病。最新研究表明,在60岁以上的人口中PD的患病率约为1%,且患病危险性有随着
就《教育部高校图书馆事实数据库》中2002~2006年上海高校图书馆系统所实际填报和产生的数据,从馆舍建筑、文献购置经费、文献资源建设、人才队伍等环节对上海高校图书馆系统
一、猪鬃的收集1.拔鬃法。活猪身上拔鬃最好在夏季进行,此时正是换毛脱鬃期。第一次拔毛开始前5分钟.给猪喂一些酒糟类的饲料.以使猪的毛孔得到扩张,然后趁猪吃食或静卧时,用手一边
期刊
目的:优选厚朴煮散的粉碎粒度,考察加水量对其煎出物的影响,为该煮散的临床应用提供参考。方法:制备5种规格的厚朴煮散,采用HPLC检测水煎液中厚朴酚、和厚朴酚含量,检测波长2
针对含氧煤层气变压吸附分离过程中存在的安全问题,通过实验的方法研究了吸附剂对瓦斯气体的抑爆和隔爆特性,旨在为煤矿抽排瓦斯分离过程中的安全生产提供参考.实验以甲烷与
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield