复杂网络中重叠社区发现算法研究

来源 :南京财经大学 | 被引量 : 2次 | 上传用户:zhang11289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,绝大多数的复杂系统都可以抽象成复杂网络,如生物蛋白质网络、社交网络、无线传感器网络、流行病传播网络等等。学者多年来研究发现,真实网络除了有无标度性质、小世界特征和局部聚集特征外,还具有社区结构特征。社区内部连接密切,社区之间连接稀疏。组成社区的节点通常功能相近或性质相似,因此社区被认为有助于揭示网络结构和功能之间的关系。网络中有些节点可能属于多个社区,于是产生了重叠社区。重叠社区是不同社区之间的纽带,能够更真实地反映网络结构,研究重叠社区具有重要意义。现有社区发现算法的结果和效率都很好,但没有哪个是十分完美的。例如大部分社区发现算法尝试从整个网络角度进行划分,但是基本上所有的真实网络都是无标度的,即大部分节点连接稀疏,这在某种程度上会干扰找到真正的社区;有的算法能够划分一般性的社区结构,却不能识别重叠社区;有的算法对重叠和非重叠社区划分效果都很好,却不适用于大规模的网络等。本文主要对复杂网络中重叠社区发现算法进行研究,分为发现密集社区和大部分社区两方面。根据社区内部节点连接密切,社区之间连接稀疏这个特点,把社区发现问题转化为在图中发现密集子图的问题,提出基于总密度最大的k个有限重叠社区的发现算法,即子图间允许有限重叠,节点集合间Jaccard系数满足给定上限的情况下找到密度总和最大的k个密集子图。提出最小密集子图的概念,设计了最小密集子图的发现算法,并据此提出了重叠社区发现算法MainDS(G,k,?)和FastDS(G,k,?)。为了考查大部分社区,本文提出一种基于图熵聚类的重叠社区发现算法。借鉴信息论中熵的概念,引入图熵作为社区的模块度检验标准。图熵是对聚类节点的内连接和外连接状况的刻画,图熵越低表示图中模块度越高,通过最小化图熵的值进行聚类可以搜索局部最优社区。本质上讲这种算法是一种自底向上的种子生长式算法,种子的选择本文提供随机选择、基于度和基于聚类系数三种解决方案。算法的初始设置种子集,每个种子的生长都是独立的,一个节点可以参与多个种子的生长,使重叠社区的生成成为可能。最后通过实验证明了本文提出算法的有效性。
其他文献
Quantale是由Mulvey于1986年在研究非交换C*-代数的谱时首先提出的,其背景是给量子力学提供新的数学模型.1990年Rosenthal关于Quantale理论研究专著的出版,在很大意义上促进
本文研究下面Kirchhoff型四阶椭圆边值问题:其中△2是双调和算子,Ω为RN中的具有光滑边界的有界开区域,f:Ω×R→R和M:R→R是连续函数.一方面,由于高阶微分方程[1-13]在理论和
在全球变暖的大气候背景下,局部地区自然灾害发生频繁,严重影响该地区甚至全球的生态环境以及经济发展,同时这些自然灾害事件严重影响到人类的生产生活。晋陕蒙毗邻地区作为
本文主要在B(X)上给出了Lie中心化子的一种刻画,并分别在零积处,幂等元算子积处作了研究.主要内容如下:第一章主要介绍了本文一些常用的符号,中心化子,Lie中心化子以及文章中
种群动力学因其重要性成为数学生态学的主要研究对象.在种群动力学的早期研究中,学者们常利用微分方程描述种群的发展过程.考虑到自然界某些瞬时的干扰因素,用脉冲微分方程来
算子空间理论是数学学习系统中的一门重要科目,现阶段,经过广大学者的研究且已得到迅速发展.而通过泛函分析的学习,我们熟知投影是代数学习中的一种特殊算子且满足A2=A=A*,现
算子代数上的映射与算子代数的某些固有性质有着密切关系.为了进步探讨算子代数的结构,众多学者对可加或线性映射已经进行了大量深入的研究.近来无可加或线性假设的映射引起
本学位论文主要运用变分方法,在Nehari流形上证明所讨论的问题,在不同的条件下基态解的存在性.绪论部分,回顾了本论文所讨论问题的研究背景,研究发展过程及已有的结果.并提出
21世纪是知识化、信息化的时代,不同学科门类的文献数量急剧增加,各种各样的知识数据库层出不穷,如CNKI、Web of Science等,如何从海量的文献资源中迅速查找到自己研究领域的
第二哲学思想是由佩内洛普·麦蒂(Penelope Maddy)在为集合论公理进行辩护时提出的一种新的探究数学哲学的方式。麦蒂的整个思路主要体现在其2007年出版的《Second Philosoph