论文部分内容阅读
电子商务(Electronic Business)是指利用电子技术从事相关商业活动。电子商务系统通过Internet网络建立虚拟的网上商店。随着电子商务系统规模的不断扩大,对于网上商店的用户来说,需要在大量的无关的商品中,花费过多的时间和精力才能挑选到自己心仪的商品。针对这类信息过载的实际问题,为了帮助消费者方便快速的购物,推荐系统技术应运而生。推荐系统的目的是在实时性的要求下,产生有效的而又精确的推荐结果,因此,近年来研究人员提出了各种不同的推荐系统的算法,目前主要的推荐系统算法包括:基于关联规则的推荐算法(AssociationRule-based Recommendation, ARBR)、基于内容的推荐算法(Content-basedRecommendation, CBR)、协同过滤推荐算法(Collaborative FilteringRecommendation,CFR),以及混合推荐算法(Hybrid Recommendation,HR)。其中,协同过滤推荐算法拥有很好的推荐精度和可扩展性,是极为成功的一类推荐模型。近几年来,推荐系统面临着大数据量和推荐实时性的双重考验,本文从推荐模型的技术角度出发,提出一种兼备协同过滤推荐模型的性能,以及并行计算高速率的推荐模型。本论文的主要研究工作概括为以下几个部分:①分析比较了主流电子商务推荐算法的特点,详细阐述了基于规范矩阵因式分解的协同过滤推荐(RMF)模型及其演化模型;②从理论上分析了RMF的模型构造和训练过程,从而发现并指出阻碍RMF模型实现并行化的最大障碍在于项目特征和用户特征之间的相互依赖关系;③研究RMF模型处理过程中的随机梯度下降法(SGD)和最小二乘法(P-ALS),实现利用交替随机梯度下降(ASGD)法替代SGD来处理模型的参数训练过程,以消除训练过程中特征之间的相互依赖关系;④提出并实现了并行的协同过滤推荐模型(P-RMF)模型,这种模型可以同时对用户特征和项目特征参数进行并行训练,以保证不降低预测精度的同时,提高运行效率。⑤通过在MovieLens1M和Netflix这两个大型实际的数据集上的实验,与原始RMF模型及基于交替最小二乘法模型(P-ALS)相比较,验证本论文提出的P-RMF模型推荐精度以及运行效率。