论文部分内容阅读
互联网技术的飞速发展,满足相同功能属性而具有不同非功能属性的候选服务呈爆炸性增长,人们面临严重的信息过载问题。同时,在利益驱使下网络上出现大量的虚假服务和虚假反馈,如何鉴别和挑选可信的服务和反馈也是服务使用者面临的问题。推荐系统在解决信息过载方面已经取得了很大的成功,但也存在着数据稀疏、冷启动等问题。如何在评分数据稀疏的情况下获得满意的推荐成为推荐系统的亟待解决的问题。针对上述问题,将信任引入推荐系统。信任不仅可以作为用户间评价相似度的补充,同时其具有的传递性也可以将原本没有关联的用户关联起来。现有的基于信任的推荐算法在候选推荐用户搜索阶段直接使用经典的图遍历或随机遍历算法,没有考虑大规模数据对算法的影响。在度量候选推荐用户推荐能力阶段,很多算法基于布尔型信任关系,忽略了信任的可度量性。一些算法仅根据用户间的距离来度量信任值,忽略了用户间偏好的相似性对信任程度的影响。还有一些算法根据用户间评分数据的某种相似性确定用户间信任值,这种方法不适合在数据稀疏情况下进行。另外,现有的算法大多没有考虑信任的领域相关性。针对上述问题,本文主要工作如下:(1)为缩小候选推荐用户的搜索范围,对谱聚类算法NJW进行改进以聚集出服务偏好相似用户集。考虑到服务运行环境对服务评价的影响,通过迭代方法从服务偏好相似用户集中聚集出运行环境相似的用户集;(2)为提高候选推荐用户的搜索效率,提出基于集散节点的用户搜索方法,在聚类生成的类簇中搜索用户作为候选推荐用户集;(3)提出了用户推荐质量(Quality of Recommendation,QoR)的概念,并以此作为衡量候选推荐用户推荐能力的指标。QoR的属性包括了评价相似度、领域信任值、领域相关度和亲密程度,各属性的权重通过信息熵方法来确定。最后,依据用户归属于类簇的隶属度,按比例从相应类簇中选择QoR值高的候选推荐用户组成推荐用户集,将预测评分高的服务推荐给用户。文中采用Epinions网站的真实数据Epinions数据集,设计了实验从算法的精确度、对冷启动用户的推荐、评分覆盖率以及算法运行时间4个方面证明该方法对推荐系统解决数据稀疏问题的有效性。最后将该方法应用到商品推荐应用示范中,通过具体的实例,验证本方法的有效性和应用性。