【摘 要】
:
随着网络社会媒体和电子商务的快速发展,出现了大量的产品评论信息,这些评论中隐藏着用户对产品的反馈,对这些信息进行挖掘分析,尤其是对产品评论信息的情感极性进行分析,能够给用户购物提供参考,同时能帮助商家提升产品质量,改善经营策略。情感分析技术作为文本挖掘的一个分支,逐渐成为研究热点。本文以电影评论信息为基础,进行了产品评论信息的粗粒度情感分析和细粒度情感分析;构建了LSTM和CNN相结合的粗粒度情感
论文部分内容阅读
随着网络社会媒体和电子商务的快速发展,出现了大量的产品评论信息,这些评论中隐藏着用户对产品的反馈,对这些信息进行挖掘分析,尤其是对产品评论信息的情感极性进行分析,能够给用户购物提供参考,同时能帮助商家提升产品质量,改善经营策略。情感分析技术作为文本挖掘的一个分支,逐渐成为研究热点。本文以电影评论信息为基础,进行了产品评论信息的粗粒度情感分析和细粒度情感分析;构建了LSTM和CNN相结合的粗粒度情感分析模型;细粒度情感分析方面,重点研究了产品属性的抽取与聚类方法;最后设计了影评情感分析原型系统。主要研究内容包括:(1)数据采集与预处理。利用网络爬虫技术,采集豆瓣网站多部电影的评论数据。运用分词工具进行分词、词性标注,借助停用词典去除停用词,利用词向量化技术实现文本的向量化表示,完成数据的预处理。(2)粗粒度情感分析。将词向量特征提取方法与SVM分类模型相结合,利用传统的机器学习方法进行了情感二分类。为提高分类的准确率,在研究LSTM和CNN深度学习方法的基础上,将二者结合起来,提出了LSTM_CNN的情感分类模型,并进行了实验验证。(3)细粒度情感分析。重点研究了属性词的抽取与聚类,首先利用LDA主题模型进行评论文本主题建模,结合基于频率和基于评价关系的属性抽取方法抽取属性词,再利用余弦相似度与LDA主题模型获得的种子属性词计算语义相似度,进行属性聚类,构建主题-属性词词典。借助主题-属性词词典,完成文本属性标注,结合LSTM_CNN分类模型,实现属性级的情感极性统计。(4)影评情感分析原型系统设计。基于本文获取的影评数据,设计了影评情感分析原型系统,实现对短评论文本进行粗粒度情感分析与细粒度情感分析的功能,以直观显示用户评价句子的极性统计结果及文本中各类属性的极性统计结果。
其他文献
人才培养的供给侧结构性改革必然会带来高素质、高技能人才的增量需求,而现代学徒制则提供了这种需求的土壤。基于协同创新视域系统分析了当前职业教育现代学徒制运行中存在
哺乳动物mTOR(Mammalian Target of Rapamycin)信号通路是一种非典型性丝氨酸/苏氨酸蛋白激酶,参与调控细胞的生长、分裂、自我更新以及细胞周期的进程。研究表明mTOR信号通
采用数据包络分析方法,选取影响旅游业创新绩效的相关指标,计算出海南省旅游创新绩效,并进行横向比较和纵向分析,结果显示,海南省旅游业创新绩效在国内属于前列,但旅游专利数
近年来,模糊数和直觉模糊数在各学科领域都有广泛应用。在众多应用中,梯形、三角形模糊数和梯形、三角形直觉模糊数最为常见。有大量文献详尽讨论了将一般模糊数逼近成梯形模
3D打印作为一项新兴技术,若与新能源和互联网相结合,可能会引起设计领域的新一轮变革。作为雕塑工作者,笔者认为很有必要探索雕塑与3D打印技术相结合的可能性,并将之作为课题
为避免以往中亚管道压气站设计中燃气调压橇高压、低压路各自成橇,在故障发生时会中断下游用户供气的弊端,哈南线巴佐伊压气站燃气调压橇装置采用由两个配置完全相同的橇装单
1)从事信息工作的劳动力超过劳力总额的一半。如美国,1950年只有17%职工从事信息业务,而今已有60%涉及这个工作。西欧很多国家从事信息业的劳动力竟占本国劳力总数三分之二
提出了皮革无机鞣剂鞣制机理的一个块状模型 ,并应用它解释了成革收缩温度。
本文采用1989—2011年"中国营养与健康调查(CHNS)"九次微观入户调查数据,利用Arc GIS地图和收入流动矩阵等技术分析了中国贫困代际传递在时间上的动态趋势和地理上的空间分布
目的:分析布地奈德与异丙托溴铵治疗慢阻肺的效果和患者不良反应。方法:以我院2018年2月-2019年5月期间收治的88例慢阻肺患者,将其随机分作2组,常态组44例患者采用复方异丙托