基于餐馆评论文本的主题提取及情感分析方法研究

来源 :北京化工大学 | 被引量 : 4次 | 上传用户:yulekan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业应用发展的不断深入,人们生产生活各个方面都深受影响,随之产生的各种文本数据呈爆炸式增长,这些文本的数量变得异常庞大并且蕴含着很多重要的信息。因此,从这些文本数据中准确快速地提取到有用信息的方法研究具有重要的应用价值。文本主题提取和情感分析是提取文本信息的常用方法,而推荐系统模型是文本信息应用的重要领域方向。但由于网络文本结构多样,风格迥异,中文语言复杂性等因素使中文文本信息的处理具有一定的挑战性,因此,在当前的推荐系统模型中,对文本信息的利用也非常有限。  针对以上问题,本论文基于餐馆用户评论文本致力于将主题提取和情感分析结果应用于个性化推荐模型。传统的个性化推荐系统大多基于用户与商品的历史互动行为数据建立用户的偏好模型,进而针对用户的兴趣偏好进行信息推荐。随着互联网产业的完善,庞大的网上文本评论数据能够直观反映用户的行为偏好,这些信息的利用对个性化推荐模型的建立具有很重要的参考价值。网络文本主题提取可以了解用户关注的产品特性,而情感分析可以反映用户对产品各个特征的喜恶程度,与从历史行为进行用户偏好分析相比,从用户评论得到用户的偏好更直观更准确。  本课题做了三方面的研究工作:首先对原始评论文本进行处理,构建聚类半监督主题扩展方法,从而得到用户关注的主题;接着综合现有的通用情感词典和评论文本构建专用情感词典,利用专用情感词典对用户关注的主题进行情感分析,综合得到用户的偏好;最后根据从用户评论文本中获得的用户偏好对用户进行个性化推荐。  论文使用大众点评网站用户餐馆评论文本数据对算法进行验证,结果表明,本课题提出的聚类半监督主题扩展方法对特定领域(本文选取美食评论领域)的主题提取具有良好的效果;领域情感词典的构建提升了情感分析的准确性;由用户评论文本数据获取用户偏好从而进行个性化推荐的方法在个性化推荐领域具有很重要的实践应用价值。
其他文献
脑电信号由脑神经活动产生,始终为中枢神经系统的自发性电位活动,是人体重要的生理信号。随机性及非平稳性相当强的脑电信号非常微弱、背景噪声比较复杂。其中眼电伪迹产生频度
工业过程大多是复杂的非线性过程,同时工业过程的稳定性和安全性显得尤为重要。为了保证工业生产过程的正常进行,对工业过程自动控制生产的监测和故障诊断提出要求。故障检测与
电力电子功率器件的发展,各种精确的电机数学模型的提出和控制算法的建立,使电机的控制技术得到飞速发展。特别是在单片机、数字信号处理器应用于电机控制领域,更使得各种高精度、优良控制特性和高效率的电机控制器得到实现。本文研究基于矢量控制的异步电机变频调速系统,主要研究内容如下:本文首先详细介绍矢量控制原理及SVPWM技术;对矢量控制系统的电机参数、转子时间常数、转子磁链、转速等参数分别进行算法分析。并在
随着经济技术的快速发展,在仓储管理系统中,自动化仓库已经被广泛采用,仓库中移动操作的需求越来越多。传统仓库中采用的是有线通信方式,这种通信方式布线成本较高且布线复杂,近年
计算机视觉在现代科技中发挥着越来越重要的作用,视觉导航能获取丰富的环境信息,具有直观性和高精确性等优势,成为导航技术崭新的发展方向。由于双目视觉定位和惯性测量定位
随着计算机技术的快速发展,大量的历史过程数据得以采集和保存,这就为在线故障检测与诊断提供了非常便利的条件。通过对这些数据进行分析,可以检测整个过程的运行状况,对可能存在
虽然极端学习机能够在极短的时间内获得更优的泛化性能,但因其输入层权值和隐单元阈值是随机选取的,从而使极端学习机的泛化性能受到影响。相对于单个分类器,集成分类器具有更优
自上个世纪以来,丰富的海洋资源吸引各国学者纷纷投入到海洋的研究中,水下机器人技术得到了世界各国的高度重视和空前发展。作为深海作业潜水器的重要组成部分,水下液压机械手集
随着科学技术的进步和发展,现代工业生产自动化程度越来越高,设备越来越复杂,工业生产过程也正在不断地朝着规模化、复杂化与智能化的方向发展。一旦生产过程中出现故障将可能引
随着现代社会信息化的飞速发展,人们对信息的依赖也与越来越强烈,这就迫切需要一种实用有效的信息获取技术来建立人们客观物理世界与虚幻的信息世界之间的联系。多种多样的信息