论文部分内容阅读
近年来,复杂网络的研究由于具有广泛的应用背景而受到许多领域学者的高度关注,人们对很多实际网络的拓扑共性与数学模型展开了深入的研究。然而,实际网络往往规模巨大,受限于技术和成本,我们很难获得网络的完全信息,许多复杂网络的实证研究实际上是基于非完全网络数据展开的。因此,如何对网络进行合理抽样,获得较好的抽样网络以实现对完全网络性质的准确推断,是复杂网络研究面临的一个重要问题,大数据下网络的抽样方法设计与抽样效果分析具有十分重要的价值。本文通过使用不同的抽样法分别在三个不同类型的复杂网络中进行抽样,并计算不同抽样法所得样本网络的拓扑特征量,比较其对总体初始值的估计效果,总结出适合于不同网络拓扑性质估计的抽样方法。本文第一部分(1)是背景研究,介绍了复杂网络抽样在目前时代背景下的重要性和必要性,同时分析了当前国内外在复杂网络抽样领域的研究成果和现状,并阐述了本课题研究的目的。第二部分(2)是理论分析,首先介绍了复杂网络抽样的理论基础,包括复杂网络的历史发展过程、经典复杂网络模型的特征和构建方法、常用网络拓扑特征量的介绍。然后介绍了常见的三种抽样方法的抽样思路,以及基于滚雪球抽样法和完全随机抽样法结合得到的两阶段抽样法。第三部分(3-5)是方法应用,分别将完全随机抽样法、随机游走抽样法、滚雪球抽样法、两阶段抽样法以不同的抽样率分别在BA无标度网络、WS小世界网络、欧盟邮件通讯网络中进行抽样,利用所得样本网络计算拓扑特征量并比较其对总体的估计效果,总结出不同抽样方法的特点,以及其在各网络中估计不同拓扑性质时的优劣。最后一部分(6)是总结,结合上述分析总结列举适合不同网络拓扑性质估计的抽样方法,本文结尾部分指出了论文的创新点以及不足之处。