论文部分内容阅读
给定一个数据图G,团是G中的一个子图,满足任意两节点之间存在边,极大团是不被其他团包含的团。极大团枚举问题研究如何从给定图中挖掘所有极大团,广泛应用于通信网络,蛋白质交互网络,生物系统调控网络以及社交网络等领域。随着互联网技术的迅速发展,数据来源存在差异,图数据往往具有不确定性。本文针对不确定图上的极大团枚举问题进行研究,研究内容如下。首先,通过深入分析现有基于不确定图的极大团枚举方法,发现现有算法存在效率低及扩展性差的问题。其次,提出一种基于子图划分的不确定图上极大团枚举算法EUMC。该算法首先将给定的不确定图当成确定图进行处理,得到其中的极大团,然后基于得到的每个极大团,结合图中的不确定信息,枚举其中的不确定极大团集合。最后对枚举得到的所有不确定极大团按照顶点规模降序排序,依次验证每个极大团是否被前边的某个团包含,剔除其中的伪极大团,得到最终的所有不确定极大团。再次,提出一种高效的伪极大团验证算法DPMC。在对枚举得到的极大团进行排序的基础上,DPMC在检查每个极大团是否被前边的某个团包含时,无需和该团前边的所有团进行比较,其验证的基本思想是在验证的过程中,动态构建每个顶点对应的倒排表,倒排表中包含了已验证的包含该顶点的团编号,以此将团的验证转换为其中顶点编号对应的倒排表的集合交集操作。最后,基于9个真实数据集进行实验,验证了本文算法的高效性。