融合属性信息的半监督社团检测方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:akiheeca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的许多复杂系统可以抽象为复杂网络,社团结构是复杂网络的一个重要性质。研究社团结构对于理解复杂网络的拓扑结构与功能特性具有重要意义。真实的网络结构通常比较稀疏,部分网络的社团结构不够明晰。现有的社团检测算法大多只考虑网络拓扑,在处理稀疏网络和模糊社团时具有局限性。网络中未被充分利用但广泛存在的节点属性与半监督信息,可有效地弥补结构信息的不足。因此本文融合节点属性与半监督信息,对社团检测算法进行研究。主要工作如下:首先,提出了一种融合节点属性的半监督社团检测算法(SCDAN),基于非负矩阵分解模型,将网络拓扑、节点属性与半监督信息有效地融合在统一的目标函数中,实现了结构与内容信息、半监督与属性信息的互补。其次,推导出目标函数对应的更新规则,利用KKT条件优化目标函数,进而得到较为准确的社团检测结果。并用实验验证了网络结构、节点属性与半监督信息三者均对社团检测结果有不同程度的提升。最后,在真实数据集上对模型进行验证,与多种对比算法进行比较分析,证明SCDAN算法在社团检测的准确度和稳定性上具有优越性。并且该算法可获得社团的具体属性,对社团的真实语义进行解释。另外研究了半监督信息的比例对社团检测结果的影响,同时对实验参数进行了敏感性分析。最后利用Aminer数据集进行实证分析,提取社团语义信息,探究生物方面几个子领域各自的研究重点与研究兴趣,为研究者进行科研活动提供参考。综上,本文基于非负矩阵分解模型,提出了融合属性信息的半监督社团检测算法,具有较高准确率与稳定性,可对社团进行语义解释。
其他文献
随着我国水环境污染治理的日益受重视,污水处理厂的数量与日俱增,从而带来了污泥数量急剧增加但处理方法不能满足现阶段的处理需求量的严峻问题。在污泥的处置问题方面,我们
冷却塔是普遍应用于火力发电厂中循环冷却水的重要构筑物,其具有环保、节能和安全的特点。其中钢结构冷却塔因其自重轻、施工速度快以及可重复利用等优势,成为大型冷却塔结构选型的新方向。目前,国内外对钢结构冷却塔体系的研究成果较少,尚无明确规范可以参考,有必要对钢结构冷却塔进行深入研究。本文结合某一大型直筒-锥段型钢结构冷却塔工程实例,采用SAP2000通用分析软件,按照实际尺寸,建立有限元分析模型,对其静
燃料油中含硫化合物的燃烧是造成大气污染的主要来源之一,因此获得低硫化甚至无硫化的燃料油势在必行。光催化氧化脱硫作为一种绿色新型的脱硫技术,受到了越来越多研究者的关
在交流-直流变换领域,必须采用功率因数校正技术(Power Factor Correction,PFC),以减小对电网的污染和满足相关谐波标准。依据拓扑结构和电感电流工作模式的不同,可以采用多
松软煤层低投入、高效抽采瓦斯仍是当今世界难以解决的技术问题,其主要原因在于难抽放煤层的渗透率极低,造成瓦斯难以逸出,抽采效果差。贵州格目底中井煤矿K9煤层坚固性系数0
细胞膜是由脂筏和多种蛋白质组成的复杂结构,它是能够与细胞骨架和外界环境紧密相连的特殊存在。研究细胞膜蛋白的分布特征对我们研究细胞膜结构与功能起到了至关重要的作用
金属有机框架(MOFs)是由过渡金属离子或离子簇与有机配体结合,形成的具有广阔应用前景的多孔三维结构材料。MOFs在储能、催化和分离领域都有广泛的应用,而将MOFs应用于水相进
腐殖酸(Humic acid,HA)是一类有机高分子化合物,广泛分布在自然界中。腐殖酸的结构、组成和成分之所以很复杂,是因为其含有羰基、苯酚、羧基、羟基醌、氨基、烯醇等功能基团,
本文主要研究染病率依赖密度和频率的宿主-寄生虫扩散模型的Turing斑图生成问题.主要工作如下:首先,应用线性化方法分析扩散对寄生虫-宿主模型地方病平衡点E*稳定性的影响,结
随着煤炭开采范围的不断延伸,许多人口密集的城市和村庄的市政环境正在遭受采煤活动的破坏,其中煤矸石的污染问题和采空区地表塌陷的问题一直是最严重的威胁之一。而井下充填