社交网络图压缩算法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:mervin10183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着万维网(World Wide Web,WWW)的发展,社交网络的应用变得十分流行。社交网络通常是由现实中的个体之间通过朋友、血缘等社交关系建立的社交结构。将社交网络中的个体看作顶点,个体之间的联系看作边,可以将社交网络抽象成一个有向图,称为社交网络图。挖掘社交网络中的信息和研究社交网络的发展模型取决于对社交网络图的深层研究,而社交网络的规模巨大,导致对应的社交网络图的顶点和边也非常多,这是研究社交网络图的一大障碍。因此,对社交网络图进行压缩即成为社交网络图研究的首要任务。但是社交网络图和传统网络图的性质有很大的不同,根据节点的URL字典序存储后,相邻节点的邻接序列的相似度很小,不利于社交网络的压缩。本文通过研究社交网络的性质,分析出社交网络中的相似性。这种相似性表现在节点和它邻接序列表中的节点之间,这是因为节点和邻接序列表中的节点具有朋友、血缘等关系,现实中两个人的关系越亲密,其对应的社交圈的重合度也比较大。本文根据这种相似性,提出了一种新的压缩方案,称为SNComp(Social Networks Compression)。SNComp结合了BFS(Breadth First Search)算法和Rabin指纹算法。使用BFS算法能够实现对节点的层次化扫描,将父节点和它的孩子节点存储在相对临近的位置。但是使用这种方法对节点排序,节点的孩子节点之间是按照扫描的先后顺序依次排列,没有考虑孩子节点之间的相对顺序。SNComp进一步使用Rabin指纹算法,计算父节点和它的孩子节点之间的相似度值,然后通过这个值对孩子节点排序,从而可以保证子节点之间能够按照和父节点的相似度大小顺序排序。因此,SNComp能够保证存储在相邻位置的节点能够表现出很大程度的相似性。根据节点间的相似性,SNComp使用引用压缩、块压缩等压缩方法对社交网络图进行压缩,能够保证节点间相同的的部分只需存储一次,实现了对社交网络图的高效压缩存储。本文采用六组经典的社交网络数据对实验结果进行测试。主要的测试内容包括存储每条链接所用的比特数和随机访问每个节点所用的时间。最后,通过比较和分析实验结果,验证了本文的社交网络压缩算法的可行性,并且和MPk(Multi-Position linearization of degree k)算法相比,本压缩方案在压缩效率方面有所提高。
其他文献
思想政治理论课教学中应当把传统教学形式和微课、慕课等基于互联网的新教学形式结合起来,发挥各自的优势,实现"互联网+思想政治理论课"的混合式教学,以提升思想政治理论课的
对Fenton氧化-活性炭吸附组和处理印染废水进行了研究。利用正交实验确定了单独Fenton氧化处理印染废水的最佳条件:Fe2+:0.05g/L;H2O2:40mL·L-1;处理时间40min;pH值3,脱色率
目的:探讨经阴道闭孔无张力尿道中段悬吊术(TVT-O)治疗女性压力性尿失禁(SUI)的护理。方法:总结了13例经闭孔无张力尿道悬吊术的病情观察和护理体会,分别从术前护理、术后护
目的探索运用"4+X"健康干预法对减少反复呼吸道感染复发和小儿体质发育的影响。方法选取某社卫中心儿童保健门诊所接诊的反复上呼吸道感染患儿160例,采用随机法将研究对象分
目的观察艾灸治疗肛肠术后尿潴留的临床护理疗效,为肛肠术后患者的治疗和护理提供一定的依据。方法 90例肛肠术后尿潴留的患者随机分成对照组和观察组,各45例。对照组采用站
一般认为,德沃夏克是十九世纪捷克民族乐派的重要代言人,他的创作思想中主要体现了强烈的民族主义精神。文章结合时代背景,对德沃夏克的创作思想进行了再认识,并对其作品中的
改革开放以来,我国加强信息化水平建设,互联网产业发展突飞猛进,取得了巨大的成就.本文就动态前端开发技术的现状和优化策略进行了分析,加深这部分内容的理解,促进互联网相关
根据CNKI的相关数据,对《西南大学学报》(自然科学版)2005年-2012年刊载论文的被引频次、篇均引文量、下载量、作者发文情况、基金被引情况等进行了统计分析研究.研究指出:《
依据土壤质量评价中所存在的模糊性和渐变性的特点,采用模糊数学和污染指数法对长春市土壤中重金属(Pb、Cu、Ni、Zn)综合污染状况进行环境质量评价,并进一步对各评价因子在不
根据CNKI的相关数据,对2005年-2012年《西南大学学报》(自然科学版)出版内容结构,刊载论文的下载量、浏览量,下载用户单位,基金资助发表论文数,被访文献所属学科,文献访问数