【摘 要】
:
网络表示学习旨在研究网络中节点的低维表示,进而将这种低维表示应用于聚类、分类、社区发现、链路预测等场景。使用随机游走产生序列,从该序列中提取网络中节点的低维特征,是网络表示学习常用的方法。对于该类算法而言,随机游走序列的产生至关重要。在运算资源有限的情况下,产生能尽量包含更多信息的随机游走序列,对后续网络表学习的特征提取阶段有很大帮助。本文围绕传统随机游走的两点不足,对随机游走序列产生的方法展开讨
论文部分内容阅读
网络表示学习旨在研究网络中节点的低维表示,进而将这种低维表示应用于聚类、分类、社区发现、链路预测等场景。使用随机游走产生序列,从该序列中提取网络中节点的低维特征,是网络表示学习常用的方法。对于该类算法而言,随机游走序列的产生至关重要。在运算资源有限的情况下,产生能尽量包含更多信息的随机游走序列,对后续网络表学习的特征提取阶段有很大帮助。本文围绕传统随机游走的两点不足,对随机游走序列产生的方法展开讨论,探索更有效的随机游走序列产生的方法。第一,传统随机游走方法只保留了局部信息,忽略了全局信息。对整个网络而言,邻接信息表现的是网络的局部相似性,而高阶相似性保存了网络的全局信息。本文针对这一不足提出了一种改进方法,该方法在随机游走之前,计算中心节点和周围邻居节点的二阶相似性,从某个中心点开始,选择下一节点时,按照该二阶相似性比值产生的概率分布进行选择,而不是随机的等概率选择。本文将这种改进之后的随机游走方法应用于DeepWalk算法中,通过对聚类、分类、社区发现等实验场景的对比,发现这种改进在各项指标中确实优于原先基于传统的随机游走的网络表示学习方法。第二,传统随机游走并未考虑属性相似性。对于节点带属性的网络而言,随机游走时要保留的不仅是其局部相似性和全局相似性,还应该保留其属性相似性,而对于这类网络如果直接利用传统的随机游走,则只保留了局部信息。针对这一不足之处,本文提出另一种随机游走的改进方法,对于每个点都和周围点计算属性相似性,并将属性相似性的大小生成概率分布,按照该概率分布选择下一节点。该算法将节点的属性特征融入随机游走的选路过程中,产生的随机游走序列不仅包含网络的邻接信息,也包含了节点属性信息。本文在引文数据集上进行实验,证明该算法在“干扰边”增多的情况下,聚类结果更加稳定。
其他文献
本文主要分为七部分,文章的第一部分首先讲述了孤立子理论的研究意义及其发展过程,孤立子的应用,叙述了本文的主要研究内容;文章的第二部分首先提出了一个离散谱问题,然后运用离散零曲率表示方法导出了晶格孤子方程的一个可积晶格方程族,进而通过离散迹恒等式对产生的可积方程族建立了哈密顿结构,证明了相应晶格系统的Liouville可积性,最后求解了方程族的无穷多守恒律;第三部分,介绍了一个离散的3阶空间谱问题,
随着污水排放标准不断地提高,我国污水处理厂出水水质要求将面临比较严峻的挑战。由于土地短缺、投资过高等原因,建设新的污水处理厂难度较大。我国现状污水处理厂采用的传统二级处理工艺对TN、TP的去除效率有限,出水水质可满足《城镇污水处理厂污染物排放标准》(GB18918-2002)一级A标准要求,但不能达到《城镇污水处理厂污染物排放标准》(征求意见稿)的“特别排放限值”要求(主要指标:COD≤30mg/
采用光催化技术降解水中污染物的方法,已经受到了科学家们的广泛关注,对各种各样的光催化剂材料的研究探索也一直在持续进行中,在近些年来,钙钛矿结构材料以其优异的性能而尤
滨海软土具有天然含水率高、压缩性大等特点,这成为限制沿海地区建筑发展的核心因素。水泥土作为加固软土地基的主要方法,在全世界范围内受到了广泛的应用。滨海水泥土也成为我国沿海地区地基加固的主要方法,当以滨海水泥土作为地基时,其沉降量较大,需对其进行固结试验,研究其压缩特性。目前,针对滨海水泥土压缩特性的改性研究已成为建筑行业的热点问题。本文以纳米粘土的填充性、吸水性、膨胀性和能发生火山灰反应等性质为核
为深入了解高寒山区雪线变化规律及融雪径流过程,更好指导冰雪水资源的合理开发利用,本文以天山西部山区喀什河流域为研究区,基于MODIS、DEM和气象数据对山区雪线变化规律进
防喷器剪切闸板用于需要切断作业管柱才能确保安全封井的紧急情况。连续油管作为作业管柱的一种,在非常规和难动用储量油气田开采领域得到广泛应用,但连续油管固有的超高韧性、不易断裂等特性也使得井控安全面临着新的风险和不确定性。本文针对连续油管技术应用于油气钻采领域给井控安全带来的新挑战、新机遇,研究连续油管防喷器剪切闸板的工作机理及其剪切性能评估方法,为剪切闸板结构优化设计提供一定的理论依据。剪切闸板(冲
现代复杂化工过程一般具有易燃易爆性和生物毒性,如若发生故障,轻则导致产品质量下降,重则产生非常严重的生产安全事故。因此为保证化工过程的安全性,应采用故障检测与诊断技术对其进行实时监控。因现代计算机系统通过传感器记录了大量的化工过程数据,故基于数据驱动的故障检测与诊断技术得到了广泛的研究。由于实际化工过程存在大量非高斯数据,而独立成分分析(Independent Component Analysis
第一章HBV C编码链反基因锁核酸设计、筛选及鉴定目的:针对乙肝病毒(hepatitis B virus,HBV)编码链C基因设计合成反基因锁核酸(locked nucleic acid,LNA)片段,以HBV转基因小
《家书如虹》(The Rainbow Comesand Goes)作者为美国著名记者安德森·库珀和其母亲格洛丽亚·范德比尔特,其中记录了安德森·库珀和他的母亲之间往来书信集。原文文字亲密又极具特色,它讲述了母子双方一生永恒的智慧,透彻地展现了彼此的生活。着手翻译之前,笔者先阅读了整本书,对第二章有深刻的感悟。第二章描绘了作者母亲,即格洛丽亚·范德比尔特在青春期遇到的许多重要时刻。其中,很多都成为她
目前,大部分余热回收系统只适用于高温热流体余热的回收,对于辐射类型余热的回收研究较少且不成熟。大部分余热回收系统结构复杂,以低沸点有机物为工质运行成本较高,若发生泄露对环境危害程度较大。压缩空气对环境无污染且比较容易制备,将压缩空气储能与余热回收系统相结合,能够简化系统结构,降低运行成本。因此,开展以压缩空气为工质的余热回收系统研究具有很大的现实意义。本文结合东营坤宝化工有限公司三氯化铝生产过程,