基于受限玻尔兹曼机的协同过滤推荐算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fengljx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网技术的快速发展,网络信息呈爆炸式增长。用户面对海量复杂且冗余的数据时,用户往往无法快速寻找到有用的信息,这便会造成“信息过载”的问题。为了解决信息过载问题,推荐系统应运而生。推荐系统通过提取项目特征和收集用户的历史行为信息,然后结合相关推荐算法为用户推荐感兴趣的项目。推荐算法是推荐系统的灵魂,其中协同过滤算法是目前应用最广泛的推荐算法。然而协同过滤算法也存在着一些不足之处,如处理高度稀疏的数据集时,会导致推荐系统的精度下降从而出现数据稀疏性问题;还有处理大规模数据集时,计算效率过低导致推荐效率下降从而出现可扩展性问题。因此,如何解决数据稀疏性和算法可扩展性问题对协同过滤算法研究具有重要意义。本文以基于受限玻尔兹曼机的协同过滤推荐算法为基础,结合用户信任度、项目时间权重、多源信息聚类算法和Hadoop平台进行研究。本文的主要工作和创新如下:1.针对协同过滤推荐系统中存在的数据稀疏性问题。本文首先以用户信任度和项目时间权重为基础,改进了用户之间的相似度计算公式,然后结合多源信息聚类算法进行评分预测;同时本文也改进了受限玻尔兹曼机模型的可见层,用高斯分布单元替代二值单元,改进后可以表示实值,降低模型复杂度;最后本文通过线性加权方式把改进后的受限玻尔兹曼机模型产生的评分数据和聚类算法产生的评分数据进行融合。通过实验证明,该混合推荐算法降低了平均绝对误差,提高了推荐精度,缓解了数据稀疏性问题。2.针对协同过滤推荐系统存在的算法可扩展性问题。本文以基于多源信息聚类和受限玻尔兹曼机模型为框架,结合Hadoop分布式平台,增加冲量因子,改进受限玻尔兹曼机模型的训练方式。通过实验表明,减少了模型训练时间,提高了推荐效率,缓解了算法可扩性问题。
其他文献
随着网络技术的兴起和发展,网剧逐渐成为除上星剧外的又一大剧集来源。近年来,相较于上星剧,网剧在播出制作上有着更大的发挥空间。同时,越来越多高质量网剧的出现,也让网剧
从教与学两个层面来探究高职艺术设计专业学生实践能力的培养方法:鼓励学生善于观察和思考,培养对设计作品的鉴赏力,并采用摹仿设计的方法让学生认识设计,懂得设计到最终学会设计
针对住宅建筑现浇楼板容易产生裂缝的现象,在分析其成因的基础上从设计、材料和施工方面提出了综合防治措施。
大数据时代和智能时代的快速发展促使推荐系统逐渐成为商业应用的“标准配置”,因其在提高商业利润和满足用户的个性化需求两方面的作用,推荐系统收获了来自研究界和工业界越