基于用户行为的社区发现研究

来源 :对外经济贸易大学 | 被引量 : 0次 | 上传用户:xt100q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展和普及,各种社交类网络平台蓬勃发展,其中新浪微博是国内最大、最活跃的应用平台。微博用户通过线上的行为与其他用户建立互动连接,对用户之间形成的社交网络以及其中承载的海量信息做分析挖掘可以发现隐含的社区,进而可以很好的分析用户的行为习惯做进一步应用。  本文以新浪微博这个社交网络平台为基础,在基于用户之间的行为关系所建立的网络拓扑结构的基础上,寻找出了一种社区划分发现的算法,该方法能够实现对社交网络中的用户做精准的划分,达到发现隐含社区的一种目的,从而为后续的社区发现研究的应用做准备,比如说个性化的精准营销和社区内热点主题的发现预测等。  在本文的研究过程中,首先采集了用户的数据作为数据源;然后根据用户间的行为关系数据构建社交网络,在此基础之上采用社区划分算法对用户做聚类划分,发现隐含社区,本文在分别采用了仅基于网络拓扑结构的社区发现和仅基于语义的社区发现的方法的基础上,发现单纯的从结构或者从语义层面都不能很好的做社交网络精准聚类划分,从而提出了采用了一种将网络拓扑结构和语义挖掘相结合起来的一种网络社区发现方法,并用模块度这个社区划分效果衡量指标,验证了将结构与语义结合起来做社区划分最为有效精准,实现了对用户的精准聚类划分和隐含社区发现的目的。  本文的研究丰富了社区发现研究,贡献在于(1)理论方面,提出并采用了一种将网络拓扑结构与语义挖掘分析相结合的社区发现方法,并用实验得以验证划分结果的精准有效。(2)实验方面,在对社交网络做静态描述时,增加了对复杂网络度量指标节点度、PageRank、中心性的相关分析,验证了在微博社交媒体上,节点的度与PageRank值高度相关,同时PR值高的它的介数中心性及紧密中心性同时也很高,可以作为发现社交网络中重要影响力的节点的一种判别方法;同时在采用结构与语义相结合的谱聚类的基础上,并抽取了主题词云,为下一步的个性化推荐做准备。
其他文献
P2P网络借贷即通过网络平台实现个体与个体之间去中介化的借贷交易。投资者通过网站披露的信息可以判断借款列表中的项目是否值得投资以及是否存在违约风险。我国P2P网贷平台
学位