基于意见挖掘的协同过滤系统

来源 :山东大学 | 被引量 : 0次 | 上传用户：zyhope006

【摘要】

：

近年来,因特网已经成为有史以来存在的最大的信息源,电子零售商提供了大量的产品可供人们选择。在这种情况下,人们常面临着大量选择,例如阅读什么样的在线新闻,看什么样的电

【作者】

：

王源宏

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2013年期

【关键词】

：

意见挖掘情感分析协同过滤推荐系统张量分解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,因特网已经成为有史以来存在的最大的信息源,电子零售商提供了大量的产品可供人们选择。在这种情况下,人们常面临着大量选择,例如阅读什么样的在线新闻,看什么样的电影,或者是买什么样的商品。推荐系统是一种根据人们特定的喜好和兴趣把那些对用户有用的项目推荐给他们的工具和技术。因为把用户和最适合他们的项目匹配起来是提升用户满意度和忠诚度的关键,所以如今许多商家都对个性化推荐系统很感兴趣。这样的系统对电子商务网站尤其重要,因此电子商务领导者,比如Amazon.com和Netflix都拥有它们自己的推荐系统,以此来提升用户体验。协同过滤(CF)是在推荐系统中广泛使用的一种技术,它基于其他用户对项目的评分来为指定的用户推荐项目。这种通常以数量形式出现的评分(比如1-10星)代表了用户对项目的总体意见。然而,这种总体的意见并不能给我们提供更详细的信息。某用户对一部电影的评分为2,这可能表明该用户认为这部电影总体上是比较差的。但是他很有可能非常喜欢这部电影的其中一些方面(比如故事情节,配乐等)。大部分网站允许用户对他们购买过的项目发表文字评论,并且研究者在意见挖掘领域所做的大量工作已经允许我们从评论文本中抽取主观意见。但是,现存的大部分协同过滤算法都是仅仅利用用户对项目的总体评分来完成推荐过程,而忽略了用户可能对项目的各个方面发表的意见。鉴于这种情况,本文提出了一种能把评论文本中包含的对项目各方面的意见整合到推荐过程的新的协同过滤框架,该框架能够把评论中丰富的情感信息整合到协同过滤的流程中,并缓解数据稀疏和冷启动的问题。具体来说,该框架主要包含两个部分：(1)意见挖掘部分,(2)评分推算部分。第一个部分从评论中抽取并总结用户表达的关于项目各方面的意见,然后把这些意见转换成数字形式的评分。第二个部分使用张量分解技术来预测用户对给定项目的总体评分,该部分构成了推荐过程的基础。这种张量分解的方法可以看作是协同过滤中广泛使用的二维矩阵分解技术的扩展,此外,张量分解能够保留数据的高维特征并在每一维上抽取隐含的语义。总体上,本文主要做了如下的工作：(1)本文提出了一种新的协同过滤框架,该框架能在较细粒度上抽取评论文本中包含的关于项目的各方面的意见信息,并将此信息整合到框架中。(2)本文提出了利用张量分解技术来捕捉用户、项目以及项目各个方面的内在联系并以此预测用户对项目的评分。由于张量中包含了用户对项目的总体评分和对项目各个方面的评分,对张量的分解能提供更为准确的预测结果。(3)在电影数据集上进行的大量实验证明了本文提出的框架是有效的,实验结果显示,相对于两种基准方法,本文提出的框架能够提高评分预测的精确度。

其他文献

超分辨率方法研究

超分辨率是计算机视觉和图像处理领域的热点问题,在军事,航天,医疗,影视制作等领域有着广泛的应用前景。本文针对超分辨率重构问题,研究了图像超分辨重构方法,视频超分辨率重

学位

图像超分辨稀疏表示视频超分辨光流自回归模型高光谱图像超分辨

支持网络认证的NVD编著软件设计与实现

新一代红光高清视盘机（Next-Generation Versatile Disc，NVD）在网络化背景下推出网络认证系统（Internet Certification System，ICS），ICS编著软件是该系统的关键环节，提供制作节目光盘

学位

网络认证版权保护抽取算法导航制作

云平台可信监控框架研究

在云计算环境中，通常提供虚拟机监控功能获取虚拟机的运行状态和资源使用情况。然而，现有的虚拟机监控机制着重于对虚拟机进行粗粒度监控或仅针对特定类型的虚拟机进行监控，难以

学位

虚拟机监控监控域虚拟化技术可信计算安全监控

稀疏图子空间学习算法研究

流形学习和稀疏表示是计算机视觉、模式识别与图像处理领域中的研究热点，近年来受研究者的广泛关注。其中，流形学习的基本假设是图像在高维空间的特征表现往往蕴含着低维流形结

学位

机器视觉图像识别图像处理SGLDA算法

群组角色组合规划及约束指派研究与应用

本文旨在解决含有资源组合、约束冲突的任务组合指派问题，使协同工作分工明确具体，各部门高效有序完成协同工作。任务的组合与指派是协同工作需要处理的关键问题，合理的组合和指

学位

群组角色组合规划约束指派投资决策

编译器的语法分析测试用例生成方法研究

编译器是软件开发的基础支撑工具。它的正确性直接影响着应用软件的质量。因此编译器的质量是至关重要的。正如其他软件一样，软件测试对于编译器的开发来说是质量保证和错误检

学位

编译器测试文法覆盖测试用例生成方法语法分析

面向发布/订阅机制的动态拓扑策略的研究

发布/订阅机制或模型及其衍生模型因具有可扩展性强和松散耦合等特性已被广泛用于大规模分布式应用和系统当中，并受到越来越多的研究机构和商业公司的关注。与此同时，在使用了

学位

发布/订阅动态转换拓扑结构拓扑算法

虚拟环境下资源自适应分配技术的研究

虚拟化技术隔离硬件体系结构与软件系统的紧密依赖关系，使得多种操作系统和应用程序上运行的工作负载合并到单一物理平台上，为物理资源的共享提供了可靠的解决方案。由于各种不

学位

虚拟化资源分配服务质量要求反向传播神经网络

足球视频中的广告牌检测与替换算法研究

目前，网络视频网站的主要盈利模式为首页广告、播放缓冲广告和播放器界面广告等方式。这类盈利模式相对来说比较单一，而且会影响网站的用户体验和发展前景。在视频网站的海量视

学位

足球视频广告牌检测跟踪替换

虚拟机检查点优化机制研究

作为虚拟化的个重要特性，检查点可以对虚拟机进行系统级的状态保存，并确保完成后虚拟机可以继续运行，目前已经广泛应用于集群和数据中心的系统维护、容错灾备及测试调试上。尽管

学位

虚拟机内存压缩脏页位图检查点

基于意见挖掘的协同过滤系统

其他学术论文