论文部分内容阅读
在Internet的迅速发展和普及的背景下,互联网为人们提供了海量的信息,而且这些信息仍在爆炸式增长中。海量的信息为人们提供更多选择的同时,也带来诸多问题。人们寻找信息越来越困难,往往需要浏览了大量网页才能找到。动态的个性化推荐系统的研究为这个问题带来一种可行的解决方案,互联网也从“搜索引擎”迎来“推荐引擎”的时代。打开网页即可“所想即所得”,有时甚至会为用户做到未雨绸缪。另一方面,网站的建设更加富有成效,为不同的用户展示个性化的内容。此外,商家通过个性化推荐系统定位市场人群,实现广告的精准投放和个性化营销,这样获得了最大效益的同时,也避免了用户对盲目推荐的反感。个性化推荐的研究已经成为了各个交叉学科关注的热门领域。基于图的推荐将用户-物品关系看作是二元的二分网络结构形式,受到越来越多的关注。这种图的推荐方法通过动力学扩散的思想实现信息的过滤,对于个性化推荐系统的两个难题—冷启动问题和长尾挖掘问题提供了一种可行的解决思路,在一些广告投放,婚恋网站等实际应用场景中都采用了基于图的个性化推荐解决方案。此外,各种旨在解决“图计算”的并行架构纷纷推出,这为基于图的推荐算法进一步应用于实际场景中提供了帮助。在本文中,针对以往算法的不足,提出了基于图推荐的双向扩散思路,完成了算法原理及算法实现,再到实验证明。一般来说,用户的兴趣受到两方面的影响,一方面是用户本身的爱好,体现在用户的历史交易数据上,试图为其推荐相似的物品。另一方面是会受到周边朋友兴趣的影响,体现在拥有相同兴趣的朋友圈,可能其感兴趣的物品往往会最先在朋友圈中流行。因此新算法利用著名的随机游走方法,在之前提出的“热传导算法”基础上,增加了反馈传播来强化推荐的精准度。在两个著名的实验数据集上,本算法在推荐系统的几个指标及长尾挖掘方面,表现出了不错的性能,较以往的过滤算法有了较大程度的改善,在让人头疼的推荐冷启动问题上,基于图的推荐算法更容易将新的用户节点或商品节点扩散到尽可能多的地方,本文提出的算法在这点上具有明显的优势。此外,算法的思想很容易推广到其它的算法模型,如在双向扩散算法基础上,考虑二分网络传播的二阶冗杂性及非对称性的特点,算法性能够得到进一步的改进。