基于聚类与神经网络的协同过滤推荐系统关键技术的研究

来源 :天津理工大学 | 被引量 : 3次 | 上传用户:yxx1314521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于大数据时代的到来,网络信息资源呈爆炸式增长,不仅造成了用户很难找到有用的信息,而且加重了信息过载的现象,这种现象推动了推荐技术的发展。不难看出,推荐系统是改善上述问题的有效措施之一。到目前,协同过滤的推荐算法仍然是应用最多的推荐算法之一。协同过滤的推荐算法主要是先通过用户的相似度找到目标用户的近邻集,然后将近邻集中用户偏好的前n个项目推荐给对应的目标用户。虽然该技术在推荐系统中取得了很好的应用和成功,但是也存在一些问题,主要包括冷启动问题、数据稀疏性问题、时间因素问题和推荐精度问题。本文是以如何改善上述问题为中心展开的研究,主要分为两部分进行研究:首先,为了改善传统协同过滤推荐算法中存在的用户冷启动问题、数据稀疏性问题和时间因素问题,本文提出一种融合时间因素的用户偏好和距离加权的聚类算法,可以使推荐结果更加符合用户的爱好,从而提升用户的满意度。本文通过引入用户基本的客观特征来缓解用户冷启动问题;关于稀疏性问题的改善主要是通过引入项目类型特征,即将项目特征引入到用户-项目评分矩阵来得到小维数的用户-项目属性总评分矩阵;使用TF-IDF算法构建用户-项目属性偏好矩阵时也引入了项目特征,同时考虑用户兴趣随时间漂移对用户偏好的影响;基于上述的三个矩阵,计算加权后的欧氏距离,然后利用K-Means算法进行聚类,并在经过大量相关计算后进行推荐。其次,基于评级预测模型的推荐系统没有考虑时间背景、用户的不同类别行为等问题。过去的用户行为分析中主要考虑了用户的主观评分行为,并未同时考虑用户客观行为、基于时间的用户偏好行为以及当下流行元素的行为。因此在本文中,提出了一个新模型CNN-BP来预测用户的下一个观看行为。本文中先是使用了卷积神经网络CNN来对上述提到的四种行为序列进行分析,得到用户对于未观看项目的四种基本概率。然后使用逆向传播神经网络BP计算最终的概率,并选取最终概率高的前N项进行推荐。CNN-BP模型很好的解决了上述问题和推荐精度的问题。本文是以电影的推荐为例,在MovieLens数据集上进行了对比实验,实验结果证明了本文所提出来的算法具有更好的推荐质量和性能。
其他文献
长篇电视连续剧《神医喜来乐》(简称《神医》)火爆荧屏,这是我们既想到而又没有想到的事。所谓想到,就是当我们策划、运作这部戏的时候,特别是在看完样片后,就感到它将会给
在现代电视剧行业发展的大潮中,喜剧类型的作品并不少见。《神医喜来乐》即是其中的一个典型代表。这部剧有着自己独特的喜剧风格。其中最突出的是人物喜剧性格的塑造、不同
<正>本刊讯浦北县大成镇是广西钦州市香蕉主产区之一,每年生产香蕉6万t,约占钦州市香蕉产量的1/5。虽然当地香蕉生产总体规模很大,但是分散经营,每户经营的香蕉园很少达到0.2
期刊
5月15日,在沈阳市第13个"5&#183;15政务公开日"主题活动现场,20名企业家接过聘书,成为沈阳市首批政务公开监督员。今年的政务公开日,沈阳市以"深入宣贯政府信息公开条例,助力
本期“关注”栏目李准的《艺术想象力的一次自由飞翔》,充分肯定电视剧《神医·喜来乐》在剧作结构上的巧妙设计和编剧技巧上的娴熟运用,对提高电视剧的文学创作质量,具有一
一位从事中医的朋友告诉我,蚯蚓入药叫地龙,是最佳的药引子,若病患在脏腑深处,以地龙为药引子,就可将药性带入病深之处。蚯蚓一生一世都在地下穿洞,这药引子的道理用的就是它
目的探讨短期冥想训练对住院鼻咽癌患者心理痛苦及癌因性疲乏的影响效果。方法选取2017年7月~2018年5月于本科住院的96例鼻咽癌患者作为研究对象,采用随机数表法将研究对象分
一开始看电视连续剧《神医喜来 乐》,说句大实话,也许是由于其播 出的档期正值寒假期间春节前后,也 许是出于那种放松随意的心境,也许 是受“戏说性”的电视连续剧的影响 太
<正>19世纪末叶,意大利文学、歌剧和绘画中出现一个名叫"Il verismo",汉语大概可以翻译为"真实主义"或者"写实主义"的流派。它率先表现在文学领域里,代表人物是小说家与剧作
随着信息技术的迅速发展和广泛应用,它已深入到高校教育教学改革的各个方面,尤其是网络技术在教学中的应用已相当普遍。网络教学是一种全新的教学方式,网络技术为教育领域的