论文部分内容阅读
网络簇结构是复杂网络的一个重要属性,它体现着簇内节点相对紧密,簇间节点相对稀疏的拓扑结构特征。利用聚类分析的技术发现网络中的簇结构,是了解网络特征,分析网络行为的重要手段,对揭示复杂网络中蕴含的知识具有重大的意义。近年来,有关复杂网络的聚类算法不断地被提出,但随着网络规模增大,如何在无需先验知识的情况下,快速准确地对网络聚类,仍然是一个具有挑战性的课题。多智能体进化机制是从遗传算法演变而来,通过模拟自然界的进化过程来寻找问题的最优解。多智能体进化聚类算法将智能体的局部感知能力、自适应能力与传统进化算法的搜索方式相结合,在解决复杂网络聚类问题时无需先验知识,具有收敛速度快、精度高和鲁棒性的特点。本文将基于多智能体进化机制的思想,解决在社会网络中的社团发现和PPI网络中的蛋白质功能模块检测这两种复杂网络中的聚类问题。主要工作包括如下两部分:(1)面向社会网络的社团发现问题,我们设计了基于多智能体进化的网格环境,其中每一个智能体代表着社团发现问题的候选解。首先,我们采用基于链式的编码方式,将网络聚类问题转化为进化系统可以识别的智能体编码信息。每个智能体利用随机游走的行为,构建了网络的初始划分。然后,我们设计了包括竞争、交叉和自适应变异在内的三种在进化环境中操作的进化算子,通过智能体之间的信息交互,实现解的进化。最后,我们将算法应用在真实网络和人工合成的网络中进行实验,实验结果表明了算法能够有效地发现社团结构。(2)基于前一工作,我们对多智能体进化机制作出了一些改进,以完成PPI网络的功能模块检测。首先,针对PPI网络连接的稀疏性和多噪声,我们在启发函数中融合了基因本体论的功能注释信息,提高了节点之间相似性度量的准确性,改进了随机游走获得的解质量。其次,我们对一些进化算子进行了重新设计,提高了算法的搜索能力。最后,在进化过程结束后,我们设计了两种后处理策略,进一步优化了聚类结构,提高了功能模块检测的准确性。在三个标准数据集上的系统化实验表明,与其他算法相比,我们的算法在蛋白质功能模块检测的精度、准确率等方面都具有明显的优势。