论文部分内容阅读
自从信息技术诞生以来,随着其高速的发展,人们的生活每时每刻都在受信息技术的影响,尤其是当今的互联网的飞速发展,大大改变着这个世界,改变着人们的思考和交流方式。人类的社交需求也比以前增长了许多。各类社交网站和社交工具层出不穷,社交网络作为一种表达交流工具,已经成为人们生活中不可或缺的一部分。网络中用户众多,鱼龙混杂。不同的用户之间存在着差异,可能兴趣不同、品味不同,如果不加区分的加为好友,可能会造成沟通不畅,而且用户从好友那里获取的信息也可能不是自己想要的,这就会给用户带来不友好的体验。同时,信息过载也给用户的工作和生活带来了极大的不便和挑战。我们可以获得的信息越来越多,但我们找到自己需要的准确信息却越来越难,因此,怎样在社交网络中找到自己熟悉或者感兴趣的人是非常重要的事情。朋友推荐作为信息检索的一个领域,旨在通过计算机利用机器学习等方式挖掘出用户的特征兴趣,为用户在信息海洋中打捞出最感兴趣或者最有价值的东西。朋友推荐的出现极大的方便了用户,推动了数据挖掘领域的发展,也带来了巨大的商业价值。如今的大部分朋友推荐方法,只考虑了用户的兴趣、关注内容是否相似。这样的推荐方法只适合于虚拟网络的推荐,由此推荐的好友,他们之间的关系只是虚拟关系,在现实世界中很少有交集,因此并不能够充分满足用户的社交需求。随着使用时间的越来越长,这类添加的朋友还会被逐渐淡忘,朋友关系因此脆弱容易断裂,进而成为好友列表中的冗余信息。如今基于地理位置或者含有类似签到功能的社交软件非常普遍,软件的用户留下了大量包含地理位置的信息,地理位置信息在朋友关系中又起着举足轻重的作用,为我们进行朋友推荐的研究提供了一种新的思路。线上的虚拟好友在关系足够亲密牢固时通常会发展为线下的好友,如果好友间地理位置很近,那么他们会发展为线下好友的几率将会大大增加。如果两个用户地理位置相近,他们可能在真实世界中已经是好友,但是在虚拟网络中没有建立好友关系,推荐为好友会加强联系使得沟通更加方便。如果他们是陌生人,他们所处的环境是类似的,遇到的人和事物也是类似的,这使得他们更可能有着相同的话题,关注相同的事件,因此他们更可能因为地理位置近而成为朋友。本篇论文首先探究了地理位置在朋友推荐中的作用,初步的假设与实验之后,本文基于用户的地理位置信息提出了一种新的朋友推荐模型,在矩阵分解的基础上加入地理位置信息,对优化公式进行约束或补充。本文首先探究了三种相似度计算方法,来衡量用户与用户之间地理位置信息的共性。然后探究了三种结合方法,将挖掘的这部分信息融入到矩阵分解的框架中,使得推荐的好友不仅兴趣相似,而且地理位置也是相近的。通过本文方法推荐的好友,不仅可以在线上交流,还可以在线下面对面的交流或者共同参与同一个线下活动,这样,用户的社交经历才会更加丰富而深刻,用户的朋友关系才会维持的更久,不仅进一步巩固了好友关系,也提升了用户的体验。我们在Gowalla网站真实数据集上做了大量的实验,利用准确度,召回率和F1-measure等评价指标来检验方法的性能,通过对比发现本文提出的方法比一般的推荐算法结果有大幅度的提升,有效地弥合了线上线下的差距,为用户提供更加准确而有效地朋友推荐。