论文部分内容阅读
随着Web 2.0技术的快速发展,微博作为一种新型社交网络媒体,逐渐改变了人们沟通和获取信息的方式。然而随着微博的使用人数增长迅猛,产生的微博数据也急剧增加,用户在使用中面临着严重的信息过载。同时,鉴于微博的传播速度之快,覆盖面广,以及公开化等特点,在微博得到迅猛发展的同时也带来了隐私信息泄露方面的问题。推荐算法的出现,帮助了用户以较小时间获取有用信息,使得信息过载问题得到缓解,而微博隐私的检测则可降低用户泄露隐私信息的风险。本文通过研究目前已有的微博推荐算法,对推荐算法的理论知识进行学习总结,结合微博应用的特点以及隐私微博内容的特点,针对已有研究中存在的不足,提出了一种考虑用户隐私保护的微博内容推荐算法,在减少泄露原博主隐私的条件下,向目标用户推荐更能符合其个性特征的博文内容。首先明确了本文中推荐算法以及隐私检测所涉及的对象以及适用范围;其次,提出了一种基于标签的协同过滤微博推荐算法;然后在朴素贝叶斯分类模型的基础上,提出了一种基于多项式模型的微博内容隐私分类方法;最后结合两者,得到本文的算法,即一种考虑用户隐私保护的微博内容推荐算法。在文章的实验部分,首先设计实现了基于标签位置分析的微博用户关系度量方法,对不同的用户关系强度计算方法进行了对比实验;然后在上述实验结果的基础上,实现了基于用户的协同过滤微博内容推荐,并对其准确性进行计算;之后对微博内容隐私的分类研究进行实验,最后得出本文提出的推荐算法其准确性可行有效,并且对隐私泄露的减少可以起到一定作用。