论文部分内容阅读
随着互联网技术的迅速发展和人们社交需求的日益增长,产生了大量的社交网络数据。通常这类数据既包含用户之间的关系特征,也包含用户自身的基本信息。目前常用来进行社交网络挖掘的图聚类方法,大多数只关注节点之间的拓扑关系,而很少关注节点自身的属性特征,因此挖掘节点带有属性的图有重要的学术意义和应用前景。本文称这类节点带有属性的图为属性图,它可以分为单属性图和多属性图两大类。单属性图指节点属性特征来自单一视图,多属性图是指节点属性特征由多个视图组成。如何合理有效地融合关系特征和属性特征,来对单属性图和多属性图进行聚类是本课题的主要研究内容。针对单属性图聚类问题,本文提出一种带权重联合非负矩阵分解的聚类算法(JWNMF)。该算法将关系特征和属性特征融合在同一目标函数中,并对每个属性特征进行加权。通过对目标函数的求解,以及对包含关系特征和属性特征的矩阵进行聚类,来达到单属性图聚类的目的。与此同时,本文还证明了算法的收敛性。最后,实验结果表明JWNMF算法比现有的单属性图聚类算法有更高的聚类性能。针对多属性图聚类问题,本文提出一种带权重多联合非负矩阵分解的聚类算法(MJWNMF)。多属性图中节点属性特征由多个视图组成,因此本文参考异构协同过滤(Hete-CF)中关于用户与项目关系的融合方法,对多个视图的属性特征进行融合。然后对JWNMF算法进行扩展,把拓扑关系和多个视图的属性特征融合在同一目标函数中。类似于JWNMF算法,对包含所有视图的属性特征和关系特征的矩阵进行聚类。最后,实验结果表明MJWNMF比常用的多视图聚类算法更适合这类带关系特征的多视图数据。