复杂网络上重要节点寻找算法的研究——基于随机游走和边重要性衡量指标

来源 :山东大学 | 被引量 : 0次 | 上传用户:xbh0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别网络中重要节点的问题在社会和经济生活中有着重要的作用,近几年已经得到广泛的研究。节点的重要性也称“中心性(centrality)”,是网络分析领域的一个重要问题。这不仅因为其重大的理论研究意义,更因为其广泛的实际应用价值。它有很多应用,比如,控制爆发传染病、为电子商务产品做广告、预测流行的科学出版物、控制谣言的传播等。  对于重要节点寻找问题有各种算法,从简单的计数邻居节点的数目到复杂的算法。目前识别网络中重要节点最常用、最经典的算法有degree centrality、betweenness centrality、closeness centrality、PageRank算法等。其中,PageRank算法在实际中有广泛应用,Google搜索引擎成功地将其用于对网页进行排序。在PageRank算法或其他基于随机游走的中心性方法的随机游走过程中,随机游走者总是从其邻域中随机地选择下一个到达的节点。但在现实世界中,这种选择更可能具有“倾向性”。例如,信息在两个更亲密的朋友之间传播得更频繁。因此,在本文中,提出了两种新的考虑到这种“倾向性”的节点中心性方法,即DPRank centrality和ECP-Rank centrality。  DPRank centrality的主要思想是,为了使信息可以迅速传播,random walker不再从邻居节点中随机选择下一个节点,而是有远见地倾向于转移到具有更大度的邻居节点(或者在有向网络中转移到出度更大的节点),即random walker从当前节点vi转移到它的邻居节点vj的倾向性,与邻居节点vj的(出)度成正比。可以看出,DPRank中心性方法不仅考虑了节点的一阶邻居,还考虑到了节点的二阶邻居(即邻居的邻居)的信息。  ECP-Rank centrality的主要思想是,random walker不再从邻居节点中随机选择下一个节点,而是有倾向性地通过走“重要的”边来到达下一个邻居节点,边的重要性通过采用边重要性指标(或中心性指标)来进行衡量,如Jaccard指标、Bridgeness指标、Degree product指标和Estrada指标等,即random walker从当前节点转移到它的邻居节点的倾向性,与他们之间边的“重要性”成正比。  以上两种方法均是通过定义新的转移概率矩阵,重新衡量了复杂网络中顶点的重要性。转移概率矩阵的转置矩阵对应于最大特征值1的特征向量,即为网络中各节点重要性的得分。将DPRank centrality和ECP-Rank centrality,以及几个经典的节点中心性方法应用于多个真实网络,通过计算SIR传播模型所得的标准排序和不同中心性方法所得结果之间的Kendall系数,验证了DPRank centrality和ECP-Rank centrality两种新方法的优势。  本文的创新之处在于,在随机游走过程中,将random walker在顶点之间转移的倾向性考虑在内。据所知,这是第一次将节点中心性与边中心性相结合的节点中心性衡量方法。从试验结果来看,DPRank算法和ECP-Rank算法的结果比其他算法结果准确性高。
其他文献
随着编码理论的发展,近期,编码学者们将研究的范围从有限链环推广到有限非链环.本文主要研究的环R=Fe[u,v]/〈uk,v2,uv-vu〉就是其中之一.本文主要分为三个部分:前两个部分的内容
可靠性的应用范围很广,包括工业、农业、军事装备、医疗卫生、气象、保险等诸多方面,而对这些系统中元件寿命的研究是必不可少的。在可靠性统计中,寿命分布通常有四种:指数分布、韦布尔分布、极值分布、对数正态分布。在各种样本形式下,国内外对熟知的四种分布的可靠性统计推断研究非常之多,但在有些实际问题中,一些元件的寿命用上述四种分布来刻画往往与实际相差甚远,这说明该类元件寿命分布并不属于我们熟知的这四种分布。
学位
高炉炼铁是钢铁工业的上游主体工序,是整个钢铁工业中能耗最大的环节,高炉冶炼过程的优化控制将对钢铁工业的节能减排起到重要的作用。本文在大数据时代的背景下,以高炉现场采集
近年来,抽象代数中关于morphic的研究不断延伸,在morphic环和morphic模的研究基础上,随着不断地深入,对morphic代数的研究吸引越来越多的学者,2010年储茂权与陆贵荣在文献[13]中对
目前对于计算机视觉导航的研究主要集中于车载导航,正是由于视觉导航在智能车辆导航上的突飞猛进,将视觉导航应用到航天器自主着陆中成为许多学者研究的一个热点方向。论文围绕
图G的一个[k]-全染色是一个映射φ:V(G)∪E(G)→[k]={1,2,…,k}使得在V(G)∪E(G)中的任意一对相邻或相关联的元素染上不同的颜色。令Cφ(v)表示点v的颜色和所有与点v相关联的边
结合方案和距离正则图的Terwilliger代数是代数组合研究的一个重要问题.本文利用勒纳德对和相关的量子群给出了Johnson图的Terwilliger代数结构.勒纳德对和勒纳德三元组是近
<正>互联网约车平台发展迅猛,是"互联网+"的样板,乘客喜闻乐见,有口皆碑。政府虽然要监管互联网约车平台,但利剑始终高悬未落。我想在这里讨论的是:约车平台的命脉在哪里,怎
信用风险是指交易对手方因为违约而导致投资者遭受损失的可能性,对投资者的利益有很大影响。为了合理地管理信用风险,一些金融机构设计了与违约事件挂钩的信用衍生产品,使投资者