论文部分内容阅读
协同过滤技术已经被广泛运用于推荐系统中。在应用协同过滤的传统推荐系统中,潜在因子扮演着最重要的角色,因而如何有效地学习潜在因子成为了首要任务。传统的协同过滤方法利用矩阵分解技术从用户的物品评分矩阵中学习到潜在特征向量,但该方法面临着冷启动问题和严重的稀疏性问题。由于深度学习在很多实际应用中都可以出色地完成特征提取的任务,于是许多研究人员通过深度学习的方法来提取稀疏文本信息的特征,进而优化协同过滤方法。但由于深度学习本身的训练要求,在结合深度学习技术的推荐方法中往往存在推荐质量和训练耗时不可兼顾的问题。为解决此问题,本文将边缘降噪自动编码器和概率矩阵分解模型结合,提出基于堆叠边缘降噪自动编码器的深度协同推荐方法,该方法能够很好地兼顾训练耗时和推荐质量。首先,本文把物品文本信息的词袋向量作为堆叠边缘地降噪自动编码器的输入,通过重构加噪的词袋向量并计算原始输入数据和重构数据的交叉熵误差来进行训练。在学习到编码和解码的映射矩阵之后,我们可以通过映射矩阵得到物品对应的隐藏层特征向量。之后,将隐藏层特征向量作为概率矩阵分解模型中物品潜在特征向量的基本值,并对用户物品评分矩阵使用矩阵分解技术,可以得到评分矩阵中蕴含的用户潜在特征向量和物品潜在特征向量。由两个不同的物品潜在特征向量组成新的物品潜在特征向量,然后,利用新的物品潜在特征向量对自动编码器进行反向微调。在完成两者的迭代训练之后,利用学习得到的用户潜在特征向量和物品潜在特征向量来进行预测工作。本文在Movielens和Netflix数据集下进行实验的对比以及结果分析。实验结果表明,本文提出的基于堆叠边缘降噪自动编码器的深度协同推荐方法能够有效地缩短训练所需的耗时,而且在模型的召回率和准确率上也都有一定的提高。