论文部分内容阅读
作为数字证据分析技术的一个重要组成部分,Email群体分析技术可以让人们通过电子邮件这一媒介,间接地揭示社会群体中的社会关系。Email群体分析技术的主要思路是:通过分析Email群体网络,勾勒出群体中成员个体之间的社会关系,比如分析Email群体的团体结构即Email群体分为哪些团体以及哪些成员隶属于哪个团体,或者分析Email群体中各个成员所扮演的社会角色的重要性。网络团体结构分析算法大体分为两类,一类是分割式,另一类是聚合式。前者是通过删除连接不同团体的中介边而得到团体,后者是通过对相似度较高的节点进行聚合而得到团体,一般前者的分析准确性要高于后者。成员重要性分析算法往往根据某一个衡量指标去评估所有成员的重要性,因为所用指标比较单一且不能很好体现成员重要性,所以这些算法的准确性不高。本文首先通过阅读大量文献对Email证据分析技术和网络中的社会性关系分析方法进行了深入了解,其中着重研究了各种现有团体结构检测算法和网络成员重要性分析方法,并对它们的不足之处进行了分析。然后在此基础上在Email群体的团体结构检测和成员重要性分析两个方面提出了新的方法。首先为了检测Email群体的团体结构,本文提出了一个新的分割式网络团体结构检测算法。一个好的分割式网络团体结构检测方法要具备两个关键要素:一个准确性高的边中介性衡量指标和一个严谨的团体性验证机制。所以首先,为了准确地找出Email群体网络中需要删除的所有中介边,本算法基于边的中介-中心性,再引入Email网络中两个节点之间的沟通频率这一要素,制定了一个新的边中介性衡量指标:Mediumness,同时提出了本文的边中介-中心性计算算法。然后,本章对团体进行了严谨的定义,用于对每次分割后得到的子图进行团体性验证:如果一个子图符合团体定义,那它就是一个团体;否则需要通过删除它内部的中介边对它进行分割。最后,在以上两点的基础上对此算法进行了系统阐述。在实验阶段,本文通过一系列随机化规则构建了四种仿真网络图,每种仿真图具有20个实例,然后应用本章算法和另一个分割式团体结构检测方法去检测它们的团体结构,两个算法的检测结果表明本文算法更能准确检测出真实的团体结构;并且为了进一步分析此算法在寻找中介边时所用的边中介性衡量指标Mediumness的查找准确性,本文通过调整构图参数新建了一批仿真图,再应用这两个算法去检测它们的团体结构,两者检测成功率的对比表明Mediumness在查找中介边时有更高的准确性。其次为了评估Email群体中每个成员的重要性,基于上述的Email群体团体结构新检测算法,提出了一个新的成员重要性分析方法。这个分析方法建立了一个Email群体网络的成员重要性评估模型,这个模型从多个角度出发对每个成员的重要性进行了综合评估。本文应用这个分析方法去分析安然邮件数据集中所有成员的重要性,分析结果表明此分析方法能很大程度地分析出Email群体中所有成员的重要性。