由位置服务社交网络签到信息推断朋友关系

被引量 : 0次 | 上传用户:Spring_Song
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人群的流动性和其真实社交网络之间的关系在学术界和企业界引起了很大的关注。在过去,想要追踪人们的行径从而了解人群流动性并且获取相应的数据是一件非常困难的事情,因此,这成为了人群流动性和其真实社交网络之间关系的相关研究难以展开的主要原因。然而,随着信息时代的高速发展,各种带有GPS定位功能的移动设备和基于位置的社交网络服务相继出现并得到了十分广泛的使用。如今,我们可以通过这些设备和服务相对简单得获取大量用户的时间以及地点信息。这类信息有着十分重要的价值和用途。对这些信息加以处理和分析,我们可以获得某些特定用户的重要个人信息,比如兴趣爱好、行踪记录、真实生活下的社交圈等。本文关注的问题是如何根据两个特定用户的时间地点信息(签到数据)推断他们之间是否存在朋友关系。由于存在朋友关系的两个人通常会出现在类似或者相同的地方,因此本文认为两个人出现在同一个地点的次数以及地点个数都是判断两个人是否是朋友的重要影响因子。除此之外,两个人出现在同一地点先后间隔的时间也是影响推断结果的重要因素。通过对从以上的信息中抽取出的数据进行机器学习,本文构造了两个模型用以推断两个用户之间是否存在朋友关系。模型一仅仅通过分析两个用户共同出现的一个地点内的时间地点信息来进行朋友关系的推断。我们考虑了该地点多维的签到次数信息、该地点的特征值以及两个用户的签到时间间隔信息,并用时间间隔序列这一概念对两个用户在同一个地点的多次共同出现的签到时间间隔进行更加全面的衡量。该做法更加全面得囊括了签到数据中的有效信息,并以此建立朋友关系推断模型。该模型旨在在签到数据有限的情况下得到一个相对更加准确的推断结果。模型二是通过分析两个用户所有共同出现地点内的时间地点信息来推断他们的关系。我们使用了共同出现地点的个数、共同出现次数、地点特征和多维签到时间间隔等信息,并提出加权共同出现地点个数和加权共同出现次数这两个概念,将地点特征值作为权重来调整发生在不同地点的共同出现的重要性。该模型的推断结果比当前最优秀的基于位置的朋友关系推断模型的推断结果更加精确和有效。
其他文献
<正>一、当前安全生产形势及职业安全健康状况 党中央、国务院一贯高度重视安全生产问题,近年来采取一系列重大措施,不断加强安全生产工作。新的中央领导集体和新一届政府把
为调查太原市小店污灌区农田重金属和多环芳烃的污染状况,研究测定了45个土壤样品Pb,Cd,Cr,Hg,As以及PAHs的含量,并采用潜在生态风险评价的方法进行评价。结果表明,与背景值
<正>随着以微博、微信为代表的自媒体时代来临,机场面临的舆情环境发生了翻天覆地的变化。本文尝试用江西机场集团在实践中探索的"5-5-5"应对体系,与大家一起探讨当下中小机
进入大众文化时代的大陆电视文化,为电视娱乐节目的蓬勃发展提供了丰厚的土壤。这样的电视文化背景让台湾娱乐节目凭借自身的热闹气氛、幽默言语、趣味表演,借助网络在大陆的
选取原油、煤炭以及燃料乙醇市场代表国际能源市场,利用AR(1)-GJR(1,1)-t模型构建边缘分布,并在此基础上比较静态与时变SJC Copula的拟合状况,并对拟合较好模型的参数估计结
目的:探讨莪术对缺血性脑中风的治疗作用及机制。方法:健康成年雄性SD大鼠60只,随机分为假手术对照组、模型对照组、尼莫地平(20 mg.kg-1)组、莪术(16,8,4 g.kg-1)组,每组10
由“读”入门,“仿”中学习,并在此基础上进行写话创造。这是一个由课内到课外,从积蓄到倾吐的过程。在这个过程中由浅入深,循序渐进,遵循了学生语言能力发展的规律,有效地提
当随班就读成为我国特殊教育发展的主体形式,如何提高随班就读质量成为了众多特殊教育研究的重点。作为随班就读的重要支持体系中的资源教室方案,目前正受到广大特殊教育工作