基于聚类的超链路预测研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:nhekccxeadk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真实世界中不同的实体之间互相连接形成信息网络。在对信息网络的研究中,链路预测作为一个重要的方向,已经取得了丰硕的研究成果。但是传统链路预测算法主要是对两个节点之间是否存在链接进行预测,而现实世界中许多网络的链接关系可能存在于多个节点之间,因此超链路的概念被提出。超链路是一组包含有任意数量的同种或不同类型的节点,这些节点连接在一起形成一个多路径关系。所以超链路预测问题是对多个节点之间的关系进行预测,它打破了链路预测仅限于节点对之间预测的限制,能够预测出网络中丰富而多元的信息,因此对超链路预测问题的研究是十分有必要的。现有的超链路预测方法常常是根据整个网络中超链路的相似性来进行预测,若某一类超链路数量较多或者某类超链路之间的联系较其他类的关系更加密切,掩盖了其他类超链路的信息,那么预测出来的超链路种类偏向于这类数量较多的超链路,忽略了观察样本数量不足的超链路蕴含的信息,不能很好的体现出网络的全貌。例如若食谱网络中偏辣的食谱较多,那么预测出来的食谱也是偏辣的,其他的口味的食谱信息会被掩盖,不能预测出来。本文针对现有超链路预测方法的不足,提出了基于聚类的超链路预测方法。首先使用聚类算法对观察到的超链路进行聚类,然后对每一个簇分别建立超链路预测模型。即使某类别观察到的超链路数目较少,但是只要形成了簇,在该簇上就能得到预测结果。这种方式可以充分利用各个簇的观察样本所蕴含的信息,保证预测结果覆盖全面。本文的主要工作如下:(1)对超链路进行聚类。由于超链路形成的矩阵维度大,传统的聚类方法不便于对其进行聚类,所以本文使用非负矩阵分解对超链路矩阵进行分解,用低维的特征矩阵表示超链路矩阵,然后再使用K-means算法对低维矩阵进行聚类。最终得到的各个簇内的超链路具有较高的相似性,簇间的超链路具有较低的相似性。(2)提出了基于聚类的超链路预测算法。对聚类获得的每个簇分别建立超链路预测模型,充分利用各个簇的观察样本所蕴含的信息,保证预测结果能够覆盖整个网络,克服预测结果种类不全面,同时缩短预测时间。(3)本文使用三个真实数据集对所提方法进行了实验验证。从预测的准确性,预测结果覆盖的种类和算法的执行效率三个方面考察了基于聚类的超链路预测算法的效果和效率,并与其他超链路预测算法的结果进行了比较。结果表明基于聚类的超链路预测算法具有较好的性能。(4)基于C#语言和MVC逻辑设计并实现了基于聚类的超链路预测的原型系统。该系统直观呈现三个模块即数据预处理模块、超链路聚类模块和超链路预测模块,较为完整的还原了本文所使用的方法。
其他文献
放射治疗(RT)是一种重要的肿瘤治疗方法,但是具有若干限制,例如高剂量的X射线照射和恶性肿瘤的辐射耐受的而引起的全身副作用。用近红外光(NIR)照射进行的肿瘤的光热疗法(PTT)是另一种微创治疗方式,但是当前的研究主要集中在Ⅰ型NIR(NIR-1)窗口(700-950nm)。研究报道,通过使用精心设计的多功能纳米复合材料实现RT与PTT组合,达到癌症的高效协同热放射治疗。然而,获得生物相容性多功能
非连续颗粒增强钛基复合材料因具有加工容易、成本低和综合性能好等优点,而具备广阔的应用前景。本文利用TiB+TiC+La_2O_3三元颗粒增强IMI834钛基复合材料,开展了微观组织观察、室温拉伸和裂纹扩展试验,研究了增强体体积分数对钛基复合材料显微组织、力学性能和裂纹扩展行为的影响规律,阐明了增强体对材料断裂和裂纹扩展的影响规律,揭示了增强体在钛基复合材料中拉伸和裂纹扩展中的作用机制。本课题通过原
木质纤维素作为一种丰富的可再生资源,有望通过转化为生物质能源及多种化学品,替代当前普遍使用的化石原料。因此利用多种技术策略提高木质纤维素全组分高效利用和转化成为近年来的研究热点和重点。本论文基于现有的白腐真菌预处理木质纤维素增效酶解糖化的研究基础,拟研究不同生物质的木腐真菌/低温共熔溶剂(DES)耦合预处理技术,以进一步提高木质纤维素的酶解糖化效率,同时使用固定床热裂解技术将木质素残渣转化为高附加
本文主要研究如下具有Degn-Harrison反应格式且满足齐次Neumann边界条件的反应扩散化学模型:通过详细分析相应的特征值问题,研究模型唯一正常数平衡解的局部渐近稳定性,Turing不稳定性和Hopf分支.特别的,借助于反应扩散方程的稳定性理论和中心流行定理,获得了确定空间齐次Hopf分支性质的显示公式,其简化了Dong等已获得的结论(2017).为了验证对所获得的理论结论,给出了适当的数
乳酰谷胱甘肽裂合酶(Lac)是降解生物体内丙酮醛的重要酶之一。食品级微生物谷氨酸棒杆菌ATCC13032基因组上的NCgl0106预测为乳酰谷胱甘肽裂合酶基因,但尚缺乏实验验证。本试验首先通过PCR技术扩增出预测的谷氨酸棒状杆菌ATCC13032乳酰谷胱甘肽裂合酶基因lac,并将之与表达载体pET-28a连接,转化BL21(DE3)感受态细胞,成功获得工程菌E.coli BL21(DE3)/pET
随着社会发展,能源短缺严重限制了经济社会的可持续发展,因此大力开发可再生清洁能源迫在眉睫。半导体光催化技术可以利用太阳能光解水制取氢气,将低密度的太阳能转化为高密度的化学能,成为解决能源问题的有效途径之一。非金属石墨相氮化碳(g-C_3N_4)半导体因其独特的光电特性、合适的禁带宽度以及优异的化学稳定性等特点,被广泛应用于光催化领域,在光解水制氢能方向具有重要的科学研究价值。但是其较低的比表面积和
自然界广泛存在手性(Chirality),而手性对映体(Chiral enantiomers)无论是人工的或是天然的,在自然环境中扮演着的奇妙角色,主导着生命体的奥秘。手性农药的使用有效的增加了粮疏瓜果的产量,解决了人类的温饱问题;手性药物的使用攻克某些疑难杂症;手性添加剂的使用可以改善提高食品的品质和稳定性。但是,任何事物都具有两面性,手性农药对映体有可能严重危害生态环境和人体健康,曾有手性药物
地衣是一种经长期演化形成的“菌—藻共生”的生命体,是生态系统中附生生物的重要组成类群,在生态系统和生物多样性中占有重要的地位。岩面生地衣的种类及其群落分布特点与岩性及岩石所处的地表环境生态因子有密切的联系;树附生地衣的种类及其群落分布特点与宿主的种类及分布也存在着较复杂的关系。本研究以海南海口石山火山群世界地质公园及其周边地区和海南东北部文昌铜鼓岭国家级自然保护区为例,随机采集两地区附生在岩石表面
薄壁管件具有比强度,比刚度高和破坏形式稳定的特点,是一种理想的被动防撞保护结构,在汽车、铁路、航空航天领域得到了广泛的应用。纤维增强复合材料质轻,力学性能、可设计性强,泡沫铝质轻,抗冲击、吸能缓冲能力强。因此,使用纤维增强复合材料,泡沫铝材料对薄壁管件进行增强,可以大大提高薄壁构件的防撞性能。本论文的主要研究工作包括:(1)基于前人研究的基础上,提出了纤维增强泡沫铝填充的金属方锥台管/六边形管轴向
花青素是一种天然呈色物质,具有抗氧化、抗癌等多种生理活性。花青素结构中的酰基基团可能影响花青素的呈色性、稳定性及抗氧化性等;此外,花青素还可与某些类黄酮及金属离子