论文部分内容阅读
近几年来,随着移动互联网技术的蓬勃发展和Web2.0时代的到来,以微博为代表的新一代社交网络产品赋予了普通用户更多创造内容的自由和空间。普通用户在互联网世界的参与度在不断地提高,扮演的角色变得越来越重要,用户已经逐渐成为了互联网世界的中心,而且越来越多的用户也选择将新一代的社交平台作为信息的主要来源。然而由于随着信息数据的爆炸式增长,用户在寻找目标信息时所花费的时间和精力代价也在不断地增加。因此如何帮助用户在新一代的社交网络平台下更快更方便地获取目标信息成为了本文的主要研究目标。 个性化推荐技术是一种在海量数据中解决用户个性化需求的最具潜力的解决方案。目前国内外针对英文社交平台的个性化推荐方法已经产生了不少的研究成果,然而针对中文社交平台的个性化推荐研究工作仍然处在起步的阶段。由于中文语法本身的特殊性和微博结构复杂的特点,对中文社交网络下的个性化研究提出了很大的挑战。本文将选择当前最热门的中文社交平台新浪微博作为研究对象,针对用户在使用微博过程中遇到的信息过载和信息匮乏等问题,应用机器学习模型作为排序算法,提出了建立基于用户建模的微博个性化推荐方法。 本文将先总结分析国内外在英文社交平台下的个性化推荐研究现状,明确本文的研究背景和意义;然后简单介绍机器学习、信息检索等相关领域的研究工作,奠定本文的研究基础;随后给出本文微博个性化推荐研究的总体工作路线,并对实验前期的数据采集工作和数据预处理工作进行了概述;接下来详细介绍了本文提出的微博个性化推荐模型8在用户建模方面的主要工作,提出了针对文本的主题分析模型和针对微博其它信息的用户偏好模型,并利用机器学习的监督学习算法将用户偏好信息结合在一起,将微博排序问题转换为常见的机器学习分类问题达到微博个性化推荐的目标;最后本文在真实的微博数据集上对比了本文提出的微博个性化推荐模型与其它微博排序模型的效果,实验结果表明本文提出的个性化推荐模型能够为用户提供更精准的微博排序结果。