【摘 要】
:
当今世界中复杂系统可由表征信息的复杂网络高度抽象表示。复杂网络中的社区结构特性是其最重要的特征,从而可以通过社区检测算法对复杂网络进行挖掘来深入研究网络结构、特性和功能之间的关系。此外,复杂网络中的社团检测研究成果已广泛地应用于蛋白质复合物分析、生态环境保护、信息扩散和工程技术等多个领域。近年来文献中提出的大量社区检测算法用于获得网络中的社区划分,但是大部分算法无法在划分准确度或时间效率达到良好的
论文部分内容阅读
当今世界中复杂系统可由表征信息的复杂网络高度抽象表示。复杂网络中的社区结构特性是其最重要的特征,从而可以通过社区检测算法对复杂网络进行挖掘来深入研究网络结构、特性和功能之间的关系。此外,复杂网络中的社团检测研究成果已广泛地应用于蛋白质复合物分析、生态环境保护、信息扩散和工程技术等多个领域。近年来文献中提出的大量社区检测算法用于获得网络中的社区划分,但是大部分算法无法在划分准确度或时间效率达到良好的效果。本文首先对社区检测背景知识以及现有社区检测算法进行详细阐述,然后针对其中存在的问题提出两种基于层次聚类的改进算法。本文的主要内容和贡献如下:(1)针对层次分裂GN算法时效性差,无法应用于大规模网络的问题,本文提出了一种基于改进的Jaccard相似性系数的层次分裂算法JGN。该算法首先基于改进的Jaccard相似性系数计算网络中存在连接关系的节点之间的相似性,以相似性降序的方式指导算法切割边的操作。然后JGN算法根据层次分裂的算法流程,以贪心优化扩展模块度的方式不断给出社区划分结果。最后直至算法迭代完毕,输出扩展模块度最大值所对应的社区划分结果即为最优划分结果。JGN算法在层次分裂迭代过程中选取改进Jaccard相似性系数替代GN算法中的边介数的方式,从而提高了算法的时效性和稳定性。(2)为了进一步保证在拥有良好的时间效率的情况下,算法精度得到提升,本文提出了一种基于改进的Spearman相关系数的层次分裂算法SGN。SGN算法参考Spearman相关系数作为衡量两个变量依赖性的非参数指标的作用,然后结合共同邻居作为衡量网络中节点之间相似性的依据,来指导层次分裂过程中切割边的操作。与JGN算法改进方式类似,SGN算法采用改进Spearman相关系数替代GN算法中边介数的方式,来提高算法的准确性和时效性。为了验证本文中所提出算法的有效性,本文实验部分采用了多个不同特性的网络数据集在多个指标上比较本文提出的算法与对比算法的性能。通过实验结果分析表明本文中的社团检测算法能够高效地检测出高质量的社团结构。
其他文献
近些年来,随着科学技术的发展,人类逐步进入大数据时代。所产生的的数据量每年以指数级增长,大量的数据对于人类的发展也起到了十分重要的作用。数据量的不断增加导致从数据中提取到的特征的数量也在增加,如何有效利用与处理数量如此庞大的特征数据既是机遇也是挑战。特征选择是一种很常见的用于除去冗余与无效的特征的方法。但是一些常见的特征选择方法通常会有一些缺点,例如基于Filter特征选择算法得到的特征子集在使用
肺部疾病是医学研究的一个重要领域。无论是2020年在全球爆发的新型冠状病毒肺炎(COVID-19)疫情,还是2003年的非典型肺炎(SARS),都是病毒感染肺部引发的疾病。当前,对多种肺部疾病的研究关注于肺部血管的变化情况,如肺动脉高压、血管性病变、动静脉畸形等。为了能够早发现、早治疗,在早期诊断中通常会使用计算机辅助诊断(Computer Aided Diagnosis,CAD)技术,而快速精确
异常检测是寻找或识别异常值(与数据集中正常模式不一致的值)的方法或过程,具有十分广泛的实际背景和巨大的现实应用潜力。例如,发现异常驾驶车辆对交通系统的正常运行起到辅助作用、异常股票交易识别有利于股市的健康发展、桥梁裂缝异常检测对工程安全起到关键作用、异常网络入侵识别保证用户安全隐私等。由于问题的重要性,异常检测受到越来越多的关注。目前,异常检测中一些常见算法如2、孤立森林、LOF、神经网络重构等算
随着微电子技术的不断发展,在芯片的设计规模日益增大的情况下,协调并实现数据在芯片内部计算单元之间的快速传输,是芯片性能继续提升的保证。片上网络主要用于传输数据,而网络路由算法则用于通过控制网络来协调数据在计算单元之间传输。在众多片上网络结构中,Crossbar网络是一种传输速度快、并行度高的网络结构,被广泛地应用于连接多核以及网络互联等领域中。然而,采用同步电路实现的Crossbar网络,随着芯片
随着互联网技术的发展,国民经济、信息化水平的提高,在线教育服务行业也保持着高速增长的发展态势。用户对在线教育也提出了新的需要,在线教育正朝着个性化的方向发展。知识追踪模型是使用人工智能方法实现在线教育个性化的有效手段之一,它能够对学生学习状况进行准确诊断,并根据不同学生的特点进行个性化导学,为教师与学生带来便利,有效地提升在线教育的效率。然而目前的知识追踪模型,仍然存在一些问题:(1)模型预测结果
随着互联网的发展与壮大,越来越多的人在互联网上发表自己的观点,例如电影评论、电商评论、社会热点评论等。互联网上的这些文本具有极高的价值,如何挖掘文本中蕴藏的情感倾向已经成为了研究热点。传统的基于情感词典的方法已经无法适用于海量数据,机器学习方法的效果过于依赖人工设计的特征,因此本文将研究深度学习方法在情感分析任务中的效果。本文从网络中的公共数据集选取了两个不同类别的中文文本数据集。首先,对两个数据
针对安检机系统违禁品小目标、多目标以及目标之间相互遮挡等情况导致的检测精度不佳的问题,本文提出了一种基于RetinaNet模型改进的二次定位的目标检测模型Att-RetinaNet。首先,以RetinaNet模型为基础,通过特征金字塔(FPN)模型实现局部特征与全局特征的二次融合。其次,在融合特征之后加入自我注意力(Self-attention)模块,实现在通道与空间上的信息交互,使得模型能够筛选
中文分词是指将汉语句子按一定规则切分进而得到单独的词的过程,是中文自然语言处理中最为基础的任务。中文分词方法根据其原理可分为三类:基于规则的中文分词方法、基于统计的中文分词方法和基于序列标注的中文分词方法,目前来看第三种方法的分词效果最好。得益于计算机性能的大幅提升,神经网络再度兴起,基于序列标注思想的深度学习方法成为中文分词研究的热点。本文提出了一种以序列标注为基本思想,基于BERT模型和条件随
目的:调查颈动脉斑块在前循环区域急性缺血性卒中(acute ischemic stroke,AIS)患者及其急性卒中Org 10172治疗试验(trial of Org 10172 in acute stroke treatment,TOAST)各亚型中的分布特点;探讨导致前循环区域大动脉粥样硬化(large artery atherosclerosis,LAA)型卒中患者颈动脉易损性斑块的危险因
正电子发射断层显像技术(Positron Emission Tomography,PET)可以对脑肿瘤、脑梗塞和癫痫等脑科疾病的诊断提供良好指导作用,也可用于脑组织对于外部刺激响应的研究探索。头部含有人类最重要的中枢神经系统,组织结构精密。对脑部成像的质量要求促进了脑部成像设备的发展。临床PET系统的分辨率通常在34 mm之间,单次扫描时间较长,脑科疾病患者很难保持长时间不动,头部运动影响成像质量