论文部分内容阅读
近年来,复杂网络理论和系统生物学等复杂科学理论和技术迅猛发展。利用复杂网络方法研究大规模生物分子网络,特别是蛋白质相互作用网络中的功能模块问题得到各领域科研工作者的大量关注。大量研究成果表明,蛋白质相互作用网络中存在功能模块。许多研究者利用复杂网络理论提出了一些社区发现算法来发现蛋白质相互作用网络中的功能模块。 本文将主要比较分析几种社区发现算法在蛋白质相互网络中的应用的性能。首先利用MIPS生物数据库和科研文献构建了酵母菌蛋白质相互作用网络,并分析其复杂网络的无标度性和平均聚集系数,发现酵母菌蛋白质相互作用网络度分布满足P(k)∝ k?1.536,同时其平均聚集系数要比同等规模的随机网络的平均聚集系数要大得多,这些都暗示酵母菌蛋白质相互作用网络中蕴含着社团结构。然后介绍了基于聚合或分裂思想、模块度优化思想、信息流思想、谱聚类思想和随机游走思想的六种社区发现算法。再结合酵母菌蛋白质相互作用网络功能模块数据应用这六种算法,发现这些算法中有过度学习问题,实际的功能模块要比发现的社团要少得多并且很多小社团匹配同一功能模块。最后用模块度,纯度和信息熵等度量指标来比较分析这些社区发现算法在酵母菌蛋白质相互作用网络上的优劣,发现相比模块度和纯度,用信息熵来评价社团发现算法在功能模块发现问题上更合理。而且这些社区发现算法中FUA算法最为有效。