基于用户建模的个性化微博推荐研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:xzy200611519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着移动互联网技术的蓬勃发展和Web2.0时代的到来,以微博为代表的新一代社交网络产品赋予了普通用户更多创造内容的自由和空间。普通用户在互联网世界的参与度在不断地提高,扮演的角色变得越来越重要,用户已经逐渐成为了互联网世界的中心,而且越来越多的用户也选择将新一代的社交平台作为信息的主要来源。然而由于随着信息数据的爆炸式增长,用户在寻找目标信息时所花费的时间和精力代价也在不断地增加。因此如何帮助用户在新一代的社交网络平台下更快更方便地获取目标信息成为了本文的主要研究目标。  个性化推荐技术是一种在海量数据中解决用户个性化需求的最具潜力的解决方案。目前国内外针对英文社交平台的个性化推荐方法已经产生了不少的研究成果,然而针对中文社交平台的个性化推荐研究工作仍然处在起步的阶段。由于中文语法本身的特殊性和微博结构复杂的特点,对中文社交网络下的个性化研究提出了很大的挑战。本文将选择当前最热门的中文社交平台新浪微博作为研究对象,针对用户在使用微博过程中遇到的信息过载和信息匮乏等问题,应用机器学习模型作为排序算法,提出了建立基于用户建模的微博个性化推荐方法。  本文将先总结分析国内外在英文社交平台下的个性化推荐研究现状,明确本文的研究背景和意义;然后简单介绍机器学习、信息检索等相关领域的研究工作,奠定本文的研究基础;随后给出本文微博个性化推荐研究的总体工作路线,并对实验前期的数据采集工作和数据预处理工作进行了概述;接下来详细介绍了本文提出的微博个性化推荐模型8在用户建模方面的主要工作,提出了针对文本的主题分析模型和针对微博其它信息的用户偏好模型,并利用机器学习的监督学习算法将用户偏好信息结合在一起,将微博排序问题转换为常见的机器学习分类问题达到微博个性化推荐的目标;最后本文在真实的微博数据集上对比了本文提出的微博个性化推荐模型与其它微博排序模型的效果,实验结果表明本文提出的个性化推荐模型能够为用户提供更精准的微博排序结果。
其他文献
网格是继万维网之后出现的一种新型网络计算平台,目的是为用户提供一种全面共享各种资源的基础设施。网格中的资源与传统的分布式系统的资源相比具有分布性、动态性、异构性
蠕虫是无须计算机使用者干预即可运行的独立程序,它通过不停的获得网络中存在漏洞的计算机上的部分或全部控制权来进行传播。与传统病毒不同,它以计算机为载体,以网络为攻击
在经济全球化、社会信息化的大环境下,制造业中的先进制造技术和新的制造理念不断出现。基于虚拟现实的虚拟制造技术是其中之一。本文的研究主要针对虚拟制造系统中存在不同的
手势识别是人机交互一个重要的研究课题,由于对它的研究特别是对基于视觉的手势识别的研究顺应了近年来人机交互从机器友好型向着人类友好型发展的趋势,因此有着极大的科研和
随着信息全球化步伐的加快和互联网的飞速发展,网络成为各个企业必不可少的通信设施。许多组织机构需要与分支机构、合作伙伴实现异地互联;同时,网络应用的安全性和可靠性也变得
随着网络技术的普遍应用,其所衍生出来的数字媒体被广泛传播的同时,相应的数字版权问题,逐渐成为版权维护领域所关注的焦点。通过向数字媒体中嵌入特定的信息,可以有效地解决版权
随着分布式计算机系统的发展,特别是其典型范例—Internet的大规模的应用,多Agent系统理论产生了显而易见的价值。而多Agent技术和软件工程的结合,为开发复杂软件开辟了新的
语义Web服务是在传统Web服务的基础上对服务进行了语义封装,为服务组合的研究开辟了新方向,使语义Web服务组合成为服务组合研究的热点。本文主要研究语义Web服务组合中的服务组
网格是继传统互联网、Web之后的第三个大浪潮,可以称之为第三代互联网应用。网格计算实际上是构筑在Internet上的一组新兴技术,其目标是在动态变化的、广域分布的异构虚拟组织
计算机互联网络Internet已成为世界上最大的信息源,任何一个Internet用户都可以在网上查询他想要的信息,但是在网上除了极为有用的信息之外,还存在着许多暴力和色情等不健康内容