论文部分内容阅读
近年来,社交网络服务迅猛发展,用户人数呈爆炸式增长。通过社交网络服务,人们除了进行日常的社交行为,则更多的是将其当作公共媒体平台。调查发现,除了跟好友保持联系之外,人们使用社交网络大多是用来获取专业的知识分享以及跟踪自己感兴趣的事件或话题。社交网络中,人们的交互有明显的社区性,相同社区内的用户多具有相同兴趣或关注点并交流密切,不同社区通过关联节点进行连接。同时,由于社交网络的用户众多,每天都会产生成千上万的信息,对于个人来说,很难有效的从海量的数据中找到自己所关注的内容,因而我们有必要研究合适的方法,来帮助用户更加高效的使用社交网络。针对上述背景,本文主要研究了社交网络专业领域社区发现问题和专业领域用户社区话题监测问题。文章首先建立了社交网络专业领域社区发现模型,该模型针对用户在社交网络上对专业领域知识的需求,在充分利用社交网络数据信息的基础上,提出了能够准确识别专业领域专家用户的专业领域专家用户界定算法。在识别出的专家用户群基础上,完成了专家用户社交网络的构建及连接强度的评估,并提出了基于用户连接强度的社区划分算法。然后,本文构建了专业领域用户社区话题监测模型,该模型针对用户面对专业领域专家社区中产生的海量数据无法有效的获知其所讨论话题的问题,在充分分析社交网络数据特征及话题分布特征的基础上,提出了有监督的层次狄利克雷分配算法,并给出了分布式解决方案,从而可以高效的监测专业领域用户社区中的热门话题。经过在真实数据的验证表明,上述两个模型相比现有的解决方案,都具有更好的性能优势。最后,基于本文研究的社交网络专业领域社区发现模型和专业领域用户社区话题监测模型,构建了社交网络专业领域社区话题监测系统。文章对该系统的整体架构、各模块设计、开发环境与运行平台、系统的运行结果以及性能分析做了详细的介绍。