论文部分内容阅读
近年来,人工智能、大数据等新技术迅速发展,互联网规模逐年扩大,产生了大量的互联网企业等,人们的生活方式由此发生了巨大的改变。在信息暴增的大数据时代,人们的周围充斥着各种数不胜数的信息,难以从海量的数据中精准找到自己需要的内容,信息过载是这个时期急需解决的问题。推荐系统的产生能很好的解决这一问题,但是当新物品出现时,系统中没有关于它的任何评分信息,从而其很难被推荐给用户,因此出现了冷启动问题。为解决推荐系统冷启动问题,实现新物品的个性化推荐,本文融合关系挖掘与协同过滤算法,主要内容为:(1)本文提出了融合关系挖掘与协同过滤的物品冷启动推荐算法(IMCF)。首先基于关系挖掘提取并扩展物品特征,采用关系挖掘方法提取物品间三种相互关系,扩展属性的数量,丰富目标物品的可用属性信息,增加物品间区分度,解决了实际中物品属性信息少且难以提取的问题。然后提出基于关系挖掘的近邻选取方法,改进传统方法对物品间相似度计算的不足,解决邻近物品集单一的问题。最后将关系挖掘与协同过滤算法相结合,并引入了调节参数进行结果寻优,可以同时解决新物品完全冷启动和非完全冷启动问题。(2)本文提出了基于关系挖掘与物品权重和离散程度的推荐算法(IMWD)。首先分析了传统的余弦方法利用评分对物品相似度计算的缺陷,并提出新的相似度计算方法,充分利用每个用户信息、物品评分信息、计算物品所占权重。然后引入调节参数,与关系挖掘相似度进行融合,探寻最优结果的参数值。最后再引入物品评分数据的离散程度来计算数据的波动性,提高系统预测评分阶段的准确性,与其它方法作对比,结果证实本文方法更具优势。本文通过大量实验确定两个参数的最优值,并在数据集Movielens 100K、Movielens1M和Movielens 10M中对本文提出的推荐方法进行验证。实验结果表明,本文不仅可以解决新物品冷启动问题,而且还提高推荐系统的准确性、多样性、新颖性、覆盖率等。