基于蚁群优化的并行网络社区发现算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:moodlysea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类赖以生存的自然、社会环境中分布着多种网络,在这些网络纷繁杂芜的关系中包含着许多有价值的信息,而社区发现作为一种数据挖掘方法,对研究复杂网络的特性具有重要意义。蚁群优化算法凭借其分布式正反馈并行机制以及较强的鲁棒性与稳定性,被愈来愈频繁地应用于社区发现领域。如今已步入大数据时代,“信息爆炸”和实时更新的特性使得单机执行已不能满足大规模网络的数据信息,因此以Spark为代表的分布式计算平台应运而生。本文主要针对目前蚁群优化算法在处理社区发现问题中存在的不足,对蚁群优化算法进行改进,并在Spark分布式平台上并行实现。本文的创新点主要包括以下两方面:(1)针对蚁群优化算法求解精度低、收敛速度慢的缺陷,提出了基于标签传播的蚁群优化算法BLP_ACO。该算法首先采用一种新的解向量表达方式,解向量中每个节点位置存放该节点所属社区的标签,蚁群的任务是通过确定节点标签来构造解向量。其次,在解的构造阶段引入节点凝聚性度量,并以此来确定蚂蚁转移顺序,降低蚂蚁转移过程中的随机性,从而提高算法精度;为使算法快速收敛,将标签传播思想引入到蚁群搜索过程,提出一种基于局部社区规模和社区相似性偏向的蚂蚁定标策略,该策略结合信息素和启发式信息,综合确定节点标签。然后,在解的优化阶段引入连边率概念,采用基于模块度优化的合并策略,进一步提高算法精度。最后,在更新信息素时对所有处于社区内部的边都滞留信息素。实验部分将该算法与经典蚁群优化算法RWACO、MACO、IACO和改进的标签传播算法SOCP_LPA应用于真实网络和LFR人工基准网络,结果显示BLP_ACO能够较为准确地挖掘出社区结构,且能更快地达到收敛状态。(2)针对大数据环境,提出了基于Spark的并行标签传播蚁群优化算法SLP_ACO。该算法以Spark分布式平台的相关技术为基础,对串行BLP_ACO算法中的确定蚂蚁转移顺序模块、蚁群构造最优初步解模块和组合优化模块分别设计了分布式框架,使其并行效果达到更好;同时详细叙述了在并行化过程中使用的RDD算子,并给出了相应的RDD数据状态转换图。实验部分将该算法应用于较大规模的网络,通过加速比证明了SLP_ACO具有较好的并行性。
其他文献
生化药品是指从动物的器官、组织、体液、分泌物中经前处理、提取、分离、纯化等制得的安全、有效、质量可控的药品。这类药品的原材料来源自生物体,因此,相比于化学合成药品,前者的成分更为复杂,在药品质量控制方面也存在很多难点,其中,明确制药所用原材料的动物来源是生化药品质量控制的第一步。因为不同动物来源的药品其药效可能存在一定差异,并且不同来源的动物制品滥用可能会导致人畜共患疾病的传播以及宗教冲突的发生。
目的:应用RT-qPCR技术检测大鼠骨骼肌挫伤后有ARE结构的mRNA(AREs-mRNAs)和无ARE结构的mRNA(non-AREs mRNAs)的表达量,探索有、无ARE结构mRNA表达异质性(个体间表达差异)之间
目的:对木丹颗粒联合卡马西平治疗缺血性脑卒中后气虚血瘀型丘脑痛患者用药前后的视觉模拟评分(VAS)、低密度脂蛋白(LDL)、脂蛋白相关磷脂酶A2(Lp-PLA2)、颈动脉内-中膜厚度(IMT)、斑块积分(PS)、中医证候积分进行观察,并评估其安全性,为中西医结合治疗该病拓宽思路并提供临床研究依据。方法:对60例符合本次研究纳入标准的受试对象按照随机数字表法分为治疗组30例、对照组30例。两组均采用
在经济高速发展的今天,中国城市建设的整体竞争力不仅体现在经济和技术的竞争,更体现在文化软实力竞争。如何塑造城市的个性化名片,打造城市独特的文化形象,这在当地城市的发展中也显得愈发的重要。“禹划九州,始有荆州。”荆州建城历史长达三千多年,是荆楚文化的发祥地,也是春秋战国时期楚国的国都所在地。1982年,国务院公布的首批24座历史文化名城,荆州位列其中。这里有着丰富的楚文化历史资源,体现出了荆州很高的
资源命名实体识别和实体关系抽取是对资源描述文本进行语义信息理解的重要基础,基于实体和关系可以构建出资源库和资源知识图谱,对资源的深入研究和充分利用具有重要的意义。当前实体识别和关系抽取通常采取基于统计或者基于人工神经网络的模型,目前研究都多是将这两个过程看成分别独立的模型,按顺序依次完成两个过程,由于两个模块有着相似的底层数据处理过程,因此这种方式易造成数据重复预处理,同时也存在错误传播的问题,实
目的评估CO_2点阵激光与聚焦射频单独和联合干预对小鼠皮肤胶原的影响,并探讨可能的作用机制,为临床工作提供依据。方法选取体重30g±、雌性昆明小鼠18只,选择小鼠背部皮肤进行实验,将其背部皮肤剃毛并划分为A、B、C、D4个区域,分别为:A区域(空白对照区)、B区域(聚焦射频区)、C区域(CO_2点阵激光区)、D区域(CO_2点阵激光联合聚焦射频区)。A区域不予任何处理,B区域聚焦射频干预1次,C区
互连网络的拓扑构通常可以由无向图G(V,E)表示,其中顶点集V表示处理器,边集E表示处理器之间的通信链接.由Qn表示的n维超立方体是现今最通用的,也是最有效的互联网络拓扑结构之一,它具有许多优良的性质使之成为并行处理和并行计算系统的首先结构,并且在工业方面有着广泛的应用.为了进一步提升超立方体的性能,人们在超立方体的基础上提出了变体结构.事实上,超立方体有两种类型的变体,第一种是为了提高连通性、缩
随着城镇化进程和社会老龄化的不断加快,以及人们不健康的生活习惯,我国居民心血管疾病(CVD)呈现低龄化趋势。ST段抬高型心肌梗死(ST-elevation myocardial infarction,STEMI
本文是基于笔者2017年7月在“汉语桥”美国高中生夏令营项目中的口译实践的一篇实践报告。在为期十天活动中,笔者带领来自四个不同州的美国高中生参观了哈尔滨市具有文化底蕴
目的应用认知神经科学与功能磁共振成像技术(fMRI)的方法观察正常健康者和单相抑郁症患者不确定(风险、含糊)决策预期效用(EV)和正负估计误差(±PE)加工时的神经激活特点及其