论文部分内容阅读
随着社交网络的不断发展,其用户规模和信息量剧烈增加。在海量数据面前,用户很难找到真正与自己兴趣相投的人,获取需要的信息。好友推荐是应用于社交网络的个性化服务,旨在为用户推荐他可能认识或可能感兴趣的人。目前的好友推荐算法多是单一考虑好友的拓扑相似或兴趣相似,且在引入用户信任度仅简单考虑静态的二值信任关系。本文将综合利用用户信息和社交网络拓扑信息,提出基于用户聚类与动态交互信任关系进行好友推荐的方法。本文首先基于用户信息进行特征向量建模,在聚类过程中为了提高聚类结果的准确性和可解释性,我们改进了k-prototypes算法的分类型变量的距离计算公式,并使用改进的k-prototypes算法将最有可能成为好友的用户预先聚为k个簇类,然后在每一簇中基于拓扑社交网络信任关系对目标用户进行好友推荐。我们从全局信任关系和交互信任关系两个维度来衡量用户之间的拓扑网络信任关系。考虑到用户之间的交互信任关系是动态变化的,我们创新性的引入三个动态信任调节因子:即信任奖励因子、信任惩罚因子和时间衰减因子,经过动态信任因子调节过后的交互信任度可以全方位的刻画交互信任关系的自适应性和时间衰减性。最后在各个簇中融合全局信任度和动态交互信任度计算得出动态综合信任度,基于此为用户产生Top-N好友推荐列表。通过在腾讯微博于2012年公开的真实数据集上进行实验,首先证明了我们提出的改进的k-prototypes算法的聚类结果在各个k值下的平均畸变程度AD均低于传统的k-prototypes算法;其次,我们先聚类后在簇类内基于用户的社交行为信息进行好友推荐的方法使得网络稀疏度明显降低,缩小了传统方法进行好友推荐的搜索范围;最后,通过与传统的好友推荐方法FOAF和SNS+Content进行比对,证明本文所提出的基于用户聚类与动态交互信任关系的好友推荐方法在准确性、召回率、F1-measure指标上的优良表现和良好的时间性能。