跨社交网络用户匹配方法的设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:made5215210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,各式各样的在线社交网络已成为人们生活中的重要组成部分。人们通过Facebook、微博等社交平台来分享和获取信息。由于不同社交网络展现出不同的功能性,用户行为数据存在不同的侧重。若能匹配用户在多个社交网络中的帐号,对于构建完整用户信息和维护网络安全皆具有重要的意义。跨社交网络用户匹配问题旨在识别出同一用户在多个社交网络中相应虚拟账号。跨社交网络用户匹配为整合多源数据提供了一种可行的方案,协助众多社交网络应用,如好友推荐和内容定制,从而提升用户粘性并提高网站营收。因此如何准确地识别不同账号背后的同一用户成为了研究的热点。本文提出一种两阶段的跨社交网络用户匹配算法,可以消除用户匹配算法对种子用户的依赖,分阶段迭代匹配网络中的用户。第一阶段是基于用户名的初始用户匹配算法,该算法利用用户名优先匹配一小部分用户;第二阶段是基于多维特征的全局用户匹配算法,该算法从第一阶段匹配的初始用户出发,以宽度优先策略选择待匹配用户,利用匹配模型整合用户名、文本和网络结构等多维特征之间的特征相似度,计算用户对匹配概率并生成新的匹配用户,新匹配的用户将用于重新训练匹配模型,迭代匹配网络中剩余用户。此外,本文还提出基于社区划分的跨社交网络用户匹配算法,算法包括四个步骤:社区划分、社区匹配、并行匹配和全局匹配。基于社区划分的跨社交网络用户匹配算法可以在社区层面并行匹配用户,从而提升匹配效率以应对大规模网络。实验结果表明,本文设计的跨社交网络用户匹配方法在匹配效果、匹配鲁棒性和匹配效率上均优于对比算法。
其他文献
在数字经济时代,大多数版权作品都已实现数字化,这极大地方便了作品的使用和传播,但数字技术的发展也使得侵权成本大幅下降,从而刺激侵权现象的激增。版权人大量设置技术保护
伴随我国社会经济的高速发展,人们越来越强调经济发展与环境保护的协调,寻求以新兴产业推动我国经济的新路子。发展战略性新兴产业是抢占新一轮经济制高点的关键,是党中央的
数学核心素养是当前数学教学的重中之重,核心素养中的数学建模能力是高校数学教学中要注重培养的方面,高等数学作为大学生学习数学的重要课程,与现实生活联系密切,通过开展课
侵犯财产罪在各国是被重点打击的犯罪,也是各国学者重点研究的犯罪种类。而财产罪侵犯的法益究竟是什么,国内外刑法学界对此莫衷一是,这种争议不仅存在于刑法理论界,也存在于
本文从分析颈椎前部的肌肉、神经、筋膜等软组织与颈椎病的关系入手,结合推拿手法施术的作用机制,对手法作用于颈椎前部治疗颈椎病进行深入探讨。
本文讨论了伊朗英语教学领域内传统与现代之间的紧张关系。本文指出本世纪第二个十年标志着以下2个方面开始发生改变:1)伊朗教师和官员对英语教学的内容和方法(特别是课堂需
近世以来 ,人们一再批评中国传统哲学没有认识论或缺少认识论。这种批评有一定的正确性 ,同时又有很大的片面性。在中国传统哲学中 ,认识论的确没有像本体论与人生哲学那样得
一、戏曲化妆进化史戏曲是我们中国传统的戏剧形式。中华民族是一个智慧的民族,她所创造的艺术也是她智慧的结晶。而戏曲则是其中一颗璀璨的明珠。戏曲从宋元时代形成繁荣到
相对于光学影像对空间三维地形的描述,点云数据具有无可替代的优势,本项目基于海量三维地形点云数据,提出大容量缓存加无级缩放算法以及对图像显示方法的优化方案,研究从数据
随着海鲜产品、生物制剂、乳制品等温度敏感性产品在生活中的需求越来越大,对这类产品的保温包装研究日益重要。因此本文针对目前常用的保温包装材料,瓦楞纸箱及发泡聚苯乙烯(Expanded polystyrene,简称EPS)泡沫箱包装组合进行研究,基于热传递理论构建了泡沫包装箱及瓦楞纸箱包装组合的保温时间估算模型,通过设计试验验证模型并根据试验结果分析几种因素对包装组合保温时间的影响,对该类产品的包装有