【摘 要】
:
二十一世纪以来,随着互联网和电影产业的不断发展,网上的电影资源也越来越丰富,但同时用户从海量的电影中迅速地找到符合自己需求的电影也变得更加困难。为了使用户能够快速地找到自己喜爱的电影,协同过滤和个性化推荐系统应运而生。常用的推荐算法有基于用户或基于项目的协同过滤推荐算法,矩阵分解等,以上算法都是基于用户项目评分矩阵产生推荐。由于用户评分的客观因素,用户项目评分矩阵往往会非常稀疏,使得推荐效果不佳,
论文部分内容阅读
二十一世纪以来,随着互联网和电影产业的不断发展,网上的电影资源也越来越丰富,但同时用户从海量的电影中迅速地找到符合自己需求的电影也变得更加困难。为了使用户能够快速地找到自己喜爱的电影,协同过滤和个性化推荐系统应运而生。常用的推荐算法有基于用户或基于项目的协同过滤推荐算法,矩阵分解等,以上算法都是基于用户项目评分矩阵产生推荐。由于用户评分的客观因素,用户项目评分矩阵往往会非常稀疏,使得推荐效果不佳,进而导致用户的推荐体验较差。为了对传统协同过滤的推荐算法的效果进行改进,使得用户更精准地找到符合自己要求的电影,本文提出了基于矩阵分解和Xgboost的电影个性化电影推荐算法。该算法首先利用SVD++算法对用户评分矩阵进行处理,初步对评分矩阵进行缺失值填充,再利用填充完整的用户项目评分矩阵,根据评分向量对用户和电影进行聚类,继而再计算每个用户对于每一类用户两组评分向量之间的相似度,构造每个用户关于每类用户的相似度特征,对电影也做类似的处理。同时,在模型中加入用户和电影的属性(如用户年龄,性别,电影类别等),构造一个有监督模型,并利用Xgboost集成算法对有监督模型进行训练,从而得到推荐模型并对用户的评分进行预测。本文将所提出的MFXGB推荐算法应用于Movie Lens100k数据集中,并和传统的协同过滤推荐算法产生的结果进行对比,结果显示MFXGB的推荐效果好于传统的推荐算法。本文进一步验证了在MFXGB推荐算法中,对缺失的用户评分矩阵进行填充以及加入用户和电影的自身属性对算法有明显的提升作用。最后通过该推荐算法,产生的top10推荐列表具有较好的准确率和召回率。
其他文献
在中国古代漆器发展史上,素髹漆器是具有独特地位的一种漆器类型,它于新石器时代开始出现,两宋时期发展到巅峰。两宋时期的素髹漆器在特定的历史条件下兴起并对后世漆器产生重要的影响。文章首先论述了中国古代漆器史上素髹漆器的发展概貌,通过整理每个时代出土的素髹漆器,总结出无论是审美上崇尚富丽之风的时代,抑或是在审美清雅的时期,素髹漆器都有一定的地位,而中国古代素髹漆器的发展历程便是两宋素髹漆器之“缘”。文章
金砖国家是世界经济发展的新引擎,代表着世界经济发展的主要方向。其经济增速快、发展潜力大的特点让世界为之瞩目,但近年来金砖部分成员经济出现了较大波动。产业结构变动是宏观经济波动的重要来源之一,产业结构的优化调整能够促进宏观经济的良性化发展,进而缓解经济波动。本文将基于产业结构差异视角对金砖国家显著的经济波动现象进行解释,并指出基于产业结构差异视角缓解其经济波动的途径。本文根据产业结构影响经济波动的研
人才是软件服务企业发展的根本和命脉,也是核心竞争力。当前各软件服务企业对人才的需求已经不单单局限于某项专业知识,相关技术人员还需要横向发展自己的知识技能。有效的人才培养不仅是企业业务增长和规模扩大的助推器,更是增强行业竞争力的基本途径。在经济全球化趋势下,互联网经济竞争日趋激烈,市场业务的快速增长、公司规模的不断扩大都对人才的素质和层次提出了更高要求。作为知识高度密集的软件服务企业,如何更好地培养
在新媒体已然成为社会基础建设的大背景下,人们的日常行为方式发生改变,构筑起新的文化体系和社会场景。因此,从新媒体与用户的互动角度观察社会、思考社会,进而洞察日常生活中的个体存在、群体交往以及社会运转,具有重要的社会文化意义。全民K歌作为一款音乐社交软件,借助QQ和微信的用户基础迅速占领“K歌”市场,并拥有趣味互动和调音、智能打分、好友打擂、自动修音等多种功能。用户通过“K歌”进行社交,形成了音乐社
十九大报告指出:目前我国正处于全面建成小康社会的决胜阶段。然而当前城市和农村之间发展不平衡问题依旧突出,农村地区发展效率低,农村居民提高收入的后劲不足,而促进收入增长的关键在于提高人力资本水平。近几十年来,学者们关于健康人力资本的研究相对教育来说还是较为滞后。需要得到重视的是,健康与人们日常的生产生活息息相关,良好的健康水平既是经济发展的基础,也是人类发展的首要目标之一,与此同时,农村人口健康相对
本文以“作为艺术批评家的熊秉明”为题展开研究,一方面是为了避免与其他相关研究发生概念上的混淆。另一方面是因为他在艺术批评方面虽然有着相当的成就,但是目前学界对熊秉明的研究重点主要集中在熊秉明的雕塑艺术及书法理论研究。因此,这就为本文研究的展开,留下的足够的空间。熊秉明的艺术批评思想要从雕塑、书法、绘画、诗歌、展览等批评中提炼,并且不包括音乐、设计、戏剧戏曲、舞蹈、建筑和园林等批评。此外,熊秉明的艺
在医学、生命科学、保险等领域研究中,纵向数据和生存数据常常同时被收集,且二者通常是相互关联的,若仅单独分析其中之一,则有可能得到不可靠的结论。因此,为了探索这两类数据之间的相互关系并得到有效的统计推断,许多学者建立能够同时处理纵向数据与生存数据的模型,即所谓的联合模型。目前,在纵向响应的正态性假设下,联合模型得到了广泛研究。然而,一些产生于实际问题中的数据并不满足正态性假定,此时,若依然在正态性假
人身保险作为风险管理、养老保障、资产配置的一种金融工具,本身具有合同关系人复杂、产品形态多样、交费和资金领取灵活等特点,因而为洗钱犯罪分子掩饰、隐瞒和转移犯罪所得提供了便利条件。客户身份识别作为洗钱风险的首道防线,不仅仅是保险公司按照反洗钱法律法规履行法定义务的需要,更是为了确保保险公司在内控机制健全的前提下实现业务的稳健、永续发展,避免沦为洗钱犯罪分子实施违法犯罪活动的工具。基于对客户身份识别重
目前我国经济已经进入了新的发展时代,从高速增长转向高质发展,步入中等收入国家行列,企业在国际社会中的核心竞争力逐渐增强,拥有更多话语权。但是我国企业当前还存在很多问题,资本结构不合理、债务风险较高、资产负债率和杠杆率高居不下等。为进一步加强风险防范,国家适时推出“去杠杆”的政策要求,并出台了一系列相关文件和指导意见,明确对企业尤其是国有企业降杠杆提出了具体要求。随着政策的出台和调整、资本市场疲软和
贝叶斯方法的基本原理是利用观测数据提供的关于参数的似然信息,结合参数的先验信息,最终得到参数的后验信息。分层模型是指不同分组下的观测值取决于每组对应的参数,而每组的参数又会由其超参数决定,由此呈现出一种分层结构。贝叶斯方法天然的适用于这类分层结构,并且随着贝叶斯统计的不断发展以及各类统计软件和相关程序包的开发完善,贝叶斯方法成为研究分层模型的一种重要方式。本文旨在应用贝叶斯分层模型研究因变量为二分