论文部分内容阅读
微博是一种用户通过关注关系进行信息实时分享的社交网络平台,不同的用户可能会有相同的喜好,于是就会形成具有相同兴趣爱好的用户集体。这就给人们精准定位用户兴趣取向,为组织机构精准发布推荐信息提供了可能性,增加了用户获得自己感兴趣信息的概率。因此,用户的兴趣度成为微博出现以来人们研究的热点,研究产生了许多个性化的推荐方法。从现有的研究来看,对微博数据进行挖掘分析的研究有很多,其中有对微博结构的研究,也有对微博文本的研究。在这些研究模型中,对于微博用户兴趣的模型研究很少,并且没有考虑到用户的兴趣变化,由于用户的兴趣具有时间变化性,也就是用户的兴趣会因为时间的推移而产生相应的变化,可能会产生兴趣转移。基于这一特点,本文把时间作为一个影响因子引入其中,首先根据现有的潜在狄利克雷分布模型计算出微博集数据集合的主题分布,从而将用户个体的动态兴趣度计算出来;其次,由于用户之间可能形成具有相同兴趣爱好的群体,即可以通过用户之间的互动频率和相似度,计算出用户集合体之间的兴趣度,即用户兴趣的相对稳定性;再次,将用户个体的兴趣和用户兴趣集合体的兴趣进行加权,就可以获得更加准确的微博用户对于微博主题的兴趣度;最后,给出一条新的微博,根据其主题分布,以及新的微博用户对主题的兴趣度,即可计算出加权动态兴趣度。进而,逐一计算出用户的加权动态兴趣度,利用兴趣度递减的算法,对所得兴趣度进行排序,最终将TOP-N个微博推荐给用户,从而实现精准推荐。论文从模型推荐的总体精度、推荐的时间精度和不同权值对模型的影响这几个方面对提出的推荐模型进行分析,同时通过实验,将本文提出的算法与基于LDA模型的协同过滤算法和基于RT-LDA模型的协同过滤算法进行了比较。实验结果表明,本文提出的推荐模型比传统模型可以更为准确地反映用户兴趣。