【摘 要】
:
在社交数据不断增多的今天,高效的检测出社交网络中隐藏的社区结构具有重要的研究意义和实际价值。在社交网络中,社区结构是最基础、最重要的拓扑特征,目前已有多种社区挖掘
论文部分内容阅读
在社交数据不断增多的今天,高效的检测出社交网络中隐藏的社区结构具有重要的研究意义和实际价值。在社交网络中,社区结构是最基础、最重要的拓扑特征,目前已有多种社区挖掘相关的研究,而在许多的真实网络中,真正意义上的非重叠社区往往并不那么常见,因而挖掘网络中的重叠结构更具有现实意义。目前,相关学者提出了很多复杂网络重叠社区划分方法,并将其应用在真实场景的分析工作中,但是社区划分方法的研究还有很多值得注意的问题,比如社区划分算法的精度和效率还有待提高,尤其是对重叠社区而言,这就涉及到网络中的结构信息、社区边界和节点归属等概念只单纯考虑了网络的拓扑结构,而并没有考虑网络背后更多的信息。本文在对现有重叠社区划分算法进行了研究分析后,针对网络结构信息、社区边界定义和节点归属进行了创新,主要工作如下:1.针对现有聚类中的相似度概念不适用于社交网络中的问题,通过阅读文献总结,结合网络的结构信息,对相似度概念进行了扩展,结合朋友圈中共同朋友数量占比往往能体现两人关系这一特征,提出了一种新的链接强度概念来概括网络结构信息,可以更好体现出网络中节点之间的相关性,并且通过这一概念提出了网络中节点的距离度量,将其应用在了基于快速搜索和发现密度峰值的聚类算法中,提出了基于密度距离的社区发现算法,最终通过对比实验证明,该算法具有更好的社区划分质量。2.原有确定社区边界的方法基于社区内部紧密,外部稀疏这样的概念,而且都是由边的数量来确定,这对于复杂的社交网络而言,这样的方式包含的信息太少,也就会导致划分精度下降。而除了社区边界外,节点归属的判定也会影响最终的划分精度,针对这一问题,本文结合网络链接强度,提出了新的社区边界定义和节点归属定义,设计了一种基于链接强度的重叠社区发现算法,该算法基于局部扩展优化策略,从初始节点开始,逐步优化,直至社区边界不再扩大。且最终实验比较表明,该算法在社区划分精度可达到良好的效果。
其他文献
人工林土壤有机碳库作为陆地循环系统中最活跃的碳库,被认为是具有巨大能力和潜力缓解全球大气CO2温室效应的碳汇。因此,人工植被恢复土壤固碳效应及机制已成为当前土壤和全
生物柴油作为一种可再生能源,是石化柴油的良好代替品,在国家新型能源开发应用中引起了广泛关注。但生物柴油燃烧时会排放大量的氮氧化物,致使空气污染加重,有研究表明,将生
动力灾害是煤矿矿井中最严重的事故之一,由于近几年煤矿开采深度逐年增加,导致井下动力灾害的发生频率也随之增加。动力灾害发生时,煤矿井下的巷道和工作面可以被瞬间摧毁,弹射出的煤和岩石造成巷道堵塞,设备损坏甚至人员伤亡。由于井下动力灾害与天然地震特征不同,因此如何设计一种实时有效的煤矿动力灾害监测的方法,一直是煤矿灾害防治领域的热点问题。而随着近年来计算机领域的高速发展,先进的感知技术和计算机处理技术为
量子秘密共享依托量子力学的基本原理,很好地解决经典秘密共享的窃听问题,是经典秘密共享扩展到量子领域的应用。在量子秘密共享中,秘密(可以为经典消息或者量子态)的分发和
能源短缺及全球变暖是人类社会面临的两大挑战。光催化还原二氧化碳生产甲醇是抑制温室气体排放、缓解能源短缺的一种有前途的途径,近年来引起了广泛关注。为提高光催化还原
松材线虫病是重大传染性森林病害,对我国松林资源,自然景观和生态环境造成了严重威胁破坏,是森林病虫害防治的重中之重。清理松材线虫病死树是目前经济有效的防治措施,根桩作
在特定的水力条件下,坡面薄层水流出现滚波,这种特殊的水流现象会随着流程的增加不断演变聚合,使得瞬时水深增加,流速增加,水流剪切力增大,水流水动力学特性发生改变,进而作
公园是城市中重要的公共空间,大多数的城市公园以游憩功能为主并强调观赏性和游玩性。但是,随着城市的日益扩张与环境污染,公园也成为健康活动的极佳发生场所,公园内适宜的活
家蚕是一种重要的经济昆虫,同时也是鳞翅目的模式昆虫,在中国已有大约8500年的驯养历史,其生命周期包括卵、幼虫、蛹和成虫四个阶段。在长期的人工选择下,家蚕对不良环境及农
土壤有机碳(SOC)库的动态变化是衡量植被恢复生态效应的重要依据。但是,目前有关植被恢复过程中凋落物分解对SOC积累的影响机制仍存在不清楚的地方。本研究以黄土高原子午岭