面向海量用户行为数据的并行个性化推荐算法的研究与实现

来源 :北京交通大学 | 被引量 : 14次 | 上传用户:Nathan_YM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的不断发展和盛行,互联网上的信息量上升到了另一个数量级,用户很容易在海量的信息中迷失方向,服务商也很难了解用户的隐性需求,所以能预知用户的兴趣爱好并为用户主动推送符合用户兴趣的信息的服务对服务商具有重要的意义。个性化推荐服务就应此需求而逐渐成为热点,越来越多的电商站点开始部署推荐服务来吸引用户,为用户推荐信息,从而提升站点的效益。同时在学术研究上,个性化推荐也成为了热门的研究领域。本文所研究的用户行为是以资讯领域中Web浏览行为为主,有别于可显性评分的行为,Web用户行为属隐性行为,Web用户对信息的喜爱是隐性的。协同过滤是实现个性化推荐服务的热门技术,它注重用户之间的协同关系,但也存在新项目冷启动、可扩展性等问题。所以,目前将其他推荐技术如基于内容的推荐或其他学科的理论如社会网络分析、聚类等结合到协同过滤中来解决这些问题已成为研究的热点。本文基于资讯领域的行为数据,提出了一种将用户兴趣模型结合到Slope One算法中的混合推荐算法,并设计了该算法的并行化实现方案,以解决可扩展性问题。同时提出了一种基于SimHash内容相似性的推荐方法来解决新项目冷启动问题。在处理用户隐性行为的方法上,本文提出了一种根据用户在页面上的停留时间和页面内容大小来进行评分的策略。并通过利用朴素贝叶斯分类器对项目进行分类,再根据用户评分数据和时间权重来建立用户近期对项目类别的兴趣模型。在推荐过程中,本文将用户对项目类别的喜好偏差引入到Slope One协同过滤算法中来优化推荐质量。最后通过在应用数据下对本文的算法进行了实验,实验结果验证了引入用户兴趣模型到Slope One算法中可以有效地提升推荐质量,并能很好的解决新项目问题。也说明了在资讯推荐领域中,需要考虑用户个人兴趣模型的影响。
其他文献
税收中性原则的应用研究张敬群一税收中性原则(PrincipleofTaxNeutrality)原来是西方市场经济国家的一项重要税收原则。是指要求国家征税使社会所付出的代价应以征税数额为限,不干预市场机制运行而保持中
随着计算机、网络及电子技术的发展与普及,发生在网络电子领域中的侵犯财产行为也日益增多。以盗窃、抢劫为代表的侵财类犯罪是人类社会生活中最早出现的犯罪行为之一,而网络
桥梁是在铁路、公路、管线及渠道等为了跨越山谷、河流或者其他障碍物而设置并且具有承载能力和通行能力的跨越建筑物。可以说,桥梁是交通运输的命脉。然而,最近二十年来,随
美国是全球最早开展遗产景观档案系统化建设的国家之一。从遗产景观研究和保护的现实需求出发,回顾了美国遗产景观档案系统化建设的发展历程,重点分析其代表性项目美国历史景
文中对中国山岭隧道修建存在问题和今后的做法,提出建议。
随着社会经济的快速发展和人民生活水平的逐步提高,旅游逐渐成为现代人类生活中不可或缺的重要内容,是人类社会重要的生活方式和社会经济活动之一。传统大众旅游过分注重旅游
渤海S油田聚合物驱取得了较好的效果,但因强非均质性等因素影响,仍存在大量剩余油。为进一步改善聚合物驱效果,提高采收率,在物理模拟实验基础上,运用数值模拟方法,研究了渤
<正>大学生也有偷窃行为,这似乎与大学生的形象相距甚远,但事实却是存在的,而且不只在少数高校,也不只是极个别的人。 大学生的偷窃行为,多数是偷窃本宿舍、本班或本校师生的
产业转型升级背景下,珠三角地区新兴产业对高技能人才的需求迅速增加。基于此,从技能培训的对象、内容、体系和效果等方面,研究美国、德国、日本和澳大利亚等发达国家职业技