论文部分内容阅读
随着互联网的发展,人们能够快速与便利地接收信息,与此同时,制造信息也非常的简单快速。目前,人们处在一种信息飞速增长的时代。但是,如何快速准确地选择自己感兴趣的信息内容?对于解决这一问题,推荐系统做出了一定的贡献。本文通过两个实证数据集Movielens1M和Movielens100K,在传统的协同过滤算法的基础上,提出改进的算法。一方面,分析了考虑评分值大小对推荐效果的影响,并进一步提出融合隐含信息来改进协同过滤算法。另一方面,通过分析传统的MSD算法的不足,提出额外考虑评分向量间的余弦值来改进MSD算法。具体的工作内容如下:
(1)研究了基于有效评分及隐含信息的推荐系统。首先对所研究的评分数据进行了分析,考虑使用部分评分偏好来改进传统的协同过滤算法。在评分矩阵的基础上,通过对评分的二值化处理,提出基于二值化评分矩阵的协同过滤算法。实验结果表明,基于二值化评分矩阵所取得的推荐准确度优于基于原始评分矩阵的协同过滤算法。
进一步在二值化评分矩阵的基础上,本文融合了隐含信息,提出基于有效评分及隐含信息的改进协同过滤算法。对于用户和对象的相似度,分别融合用户基本信息和对象特征信息。对于基于用户的协同过滤算法,在计算用户间的相似度时,除了传统的评分向量间的相似度,本文基于二值化评分矩阵并额外融合用户基本信息,提出基于有效评分及用户基本信息的改进协同过滤算法。对于基于项目的协同过滤算法,本文分析了对象的特征信息与评分的关系,提出融合对象特征信息来改进算法。基于有效的评分,通过考虑对象的发布时间、类型信息,分别提出了融合对象发布时间信息、融合对象类型信息和联合考虑对象特征信息的改进协同过滤算法。通过在多个相似度算法上实验,并与传统的协同过滤算法相比发现,本文所提的几种算法取得了更优的推荐效果。
(2)研究了考虑评分向量的余弦值来改进传统的MSD算法。分析了传统的MSD算法的不足,额外考虑评分向量的余弦值,并分别基于用户相似性和对象相似性的MSD算法,提出融合评分向量的余弦值和均方差值的改进IMSD算法。在两个数据集上进行实验表明,本文提出的IMSD算法的推荐准确度优于传统的MSD算法。另外,研究了MSD的两种优化算法,一种是结合JAC算法和MSD算法的JAC_MSD算法,另一种是额外考虑了妥协性和一致性因子的AC_MSD算法。进一步,本文将IMSD应用于改进该两种算法,提出两种优化算法JAC_IMSD和AC_IMSD算法。实验结果表明,本文所提的IMSD、JAC_IMSD和AC_IMSD较传统的MSD、JAC_MSD和AC_MSD算法,无论是考虑所有近邻或是部分近邻的情况下,都有更好的推荐准确度。因此,在MSD算法基础上考虑评分向量余弦值的IMSD算法能够取得较好的推荐效果,并且在进行推广应用时,JAC_IMSD和AC_IMSD算法仍然能够取得更高的推荐准确度。
综上所述,本文主要对传统的协同过滤算法进行了一些改进。其一,通过分析评分信息和隐含信息影响,提出考虑有效评分及隐含信息来改进先前的算法。其二,分析传统MSD算法的不足,提出一种改进的MSD算法,并将IMSD算法进行推广,提出JAC_IMSD和AC_IMSD算法。
(1)研究了基于有效评分及隐含信息的推荐系统。首先对所研究的评分数据进行了分析,考虑使用部分评分偏好来改进传统的协同过滤算法。在评分矩阵的基础上,通过对评分的二值化处理,提出基于二值化评分矩阵的协同过滤算法。实验结果表明,基于二值化评分矩阵所取得的推荐准确度优于基于原始评分矩阵的协同过滤算法。
进一步在二值化评分矩阵的基础上,本文融合了隐含信息,提出基于有效评分及隐含信息的改进协同过滤算法。对于用户和对象的相似度,分别融合用户基本信息和对象特征信息。对于基于用户的协同过滤算法,在计算用户间的相似度时,除了传统的评分向量间的相似度,本文基于二值化评分矩阵并额外融合用户基本信息,提出基于有效评分及用户基本信息的改进协同过滤算法。对于基于项目的协同过滤算法,本文分析了对象的特征信息与评分的关系,提出融合对象特征信息来改进算法。基于有效的评分,通过考虑对象的发布时间、类型信息,分别提出了融合对象发布时间信息、融合对象类型信息和联合考虑对象特征信息的改进协同过滤算法。通过在多个相似度算法上实验,并与传统的协同过滤算法相比发现,本文所提的几种算法取得了更优的推荐效果。
(2)研究了考虑评分向量的余弦值来改进传统的MSD算法。分析了传统的MSD算法的不足,额外考虑评分向量的余弦值,并分别基于用户相似性和对象相似性的MSD算法,提出融合评分向量的余弦值和均方差值的改进IMSD算法。在两个数据集上进行实验表明,本文提出的IMSD算法的推荐准确度优于传统的MSD算法。另外,研究了MSD的两种优化算法,一种是结合JAC算法和MSD算法的JAC_MSD算法,另一种是额外考虑了妥协性和一致性因子的AC_MSD算法。进一步,本文将IMSD应用于改进该两种算法,提出两种优化算法JAC_IMSD和AC_IMSD算法。实验结果表明,本文所提的IMSD、JAC_IMSD和AC_IMSD较传统的MSD、JAC_MSD和AC_MSD算法,无论是考虑所有近邻或是部分近邻的情况下,都有更好的推荐准确度。因此,在MSD算法基础上考虑评分向量余弦值的IMSD算法能够取得较好的推荐效果,并且在进行推广应用时,JAC_IMSD和AC_IMSD算法仍然能够取得更高的推荐准确度。
综上所述,本文主要对传统的协同过滤算法进行了一些改进。其一,通过分析评分信息和隐含信息影响,提出考虑有效评分及隐含信息来改进先前的算法。其二,分析传统MSD算法的不足,提出一种改进的MSD算法,并将IMSD算法进行推广,提出JAC_IMSD和AC_IMSD算法。