基于深度神经网络的文本情感分类研究

来源 :深圳大学 | 被引量 : 2次 | 上传用户:yuyuan0127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析,作为自然语言处理领域的一个重要分支,致力于从大量的非结构化文本中提取用户的意见,并根据其情感倾向进行分类。其中,基于规则和情感词典的方法比较繁琐,而传统机器学习的方法需要人工设计的特征,有待进一步改进。近年来,深度神经网络和词向量的应用,使得情感分类的效果大幅提升,但依然存在一些缺陷,模型的训练也需要大量的带标签数据。针对现有的一些问题,本文以网络用户评论数据为研究对象,主要做了以下两部分工作:(1)提出结合情感词典与注意力机制的长短期记忆网络(ALE-LSTM和WALELSTM)。虽然词向量可以捕获词语的语义和语法信息,但在情感分类任务中,仅用词向量难以准确表示单个的词语。由于词向量是根据外部语料库中词与词之间的共现关系训练得到的,如果两个词语有相似的上下文,即使他们带有不同情感倾向,也可能有相似的词向量表示。单个词语的情感表示不准确则会对文本整体情感倾向的预测造成影响。本文提出的模型首先使用情感词典来训练一个词情感分类器,利用该词情感分类器获得词的情感向量。然后,组合每个词的情感向量和原始的词向量作为LSTM最终的输入。并且,为了改善LSTM模型偏向于保存最近输入的信息,而不能保存长历史间隔的输入信息的问题,提出了带注意力机制的通用情感分类模型,以便有选择地保存文本中重要的情感信息用于分类。实验表明,ALE-LSTM和WALE-LSTM模型可以获得更高的情感分类准确率。(2)提出基于模糊与自动编码器的领域对抗模型(Fuzzy-DAAE)。多数基于深度神经网络和词向量的情感分类方法需要大量的带标签训练数据。然而,在一些新兴的领域,构造带标签的数据费时费力。领域自适应算法可以利用相关领域(源域)的带标签数据来提升目标域(带标签数据较少甚至没有)的性能。但是现有的领域自适应算法更关注不同领域的共同特征,而忽略样本本身的特性。本文提出的模型不仅使用一个梯度反转层来实现对抗训练,使领域分类器无法识别领域之间的差异,从而获得领域不变的特征,而且使用自动编码器来重建原始输入以保持样本的特性。另外,为了引入目标域样本的情感监督信息,该模型还根据样本的模糊值,将部分无标签的目标域样本及其预测标签加入到原始训练数据中,重新训练整个模型。实验结果表明,Fuzzy-DAAE模型是有效的。值得注意的是,Fuzzy-DAAE模型可以用于任何其他的领域自适应任务,而不仅限于跨领域情感分类。
其他文献
目的探讨中性Zn金属配合物对环酯开环聚合的影响。方法以取代吡啶醛、芳香胺和Zn Cl2为原料,合成和表征一系列具有不同位阻和不同电子效应取代基的吡啶亚胺类配合物,并将这些
随着城镇化速度不断加快,居民的参与意识增强,面对多元化的现代化大型社区。许多社区需求很难再适用于传统三大社区发展模式理论体系框架。政府购买服务力度的不断加大,为此
香豆素类衍生物因其多样的生物活性备受关注。本文通过Suzuki-Miyaura偶联反应对其结构进行修饰,以3-溴香豆素与各种取代的苯硼酸为原料,催化合成了9种香豆素类衍生物,丰富了
浙西《民族日报》是一份以宣传抗日救亡为己任的报纸,是抗战时期浙西前线的一面旗帜。抗日民族统一战线的建立,是浙西《民族日报》创办的契机,国民党内部派系的复杂使得《民
21世纪知识经济和信息时代的到来,使高校党建工作面临着新情况、新问题,开辟网络党建新领域、新阵地,构筑高校网络党建与传统党建有机结合的完整党建模式,是推进高校党的建设创新
韩国“恨”文化伴随着怨恨理论的不断发展以及饱受亡国之痛、分裂之恨与政治之殇使其民族逐渐形成郁结于心的“恨”文化情绪。它不是一种单一的情感状态,而是多种情绪共同作用的结果。怨恨、悲伤、遗憾、奋进……都成为“恨”情感的一部分。“恨”的民族情绪不是低级消沉的负面注解,它是企图改变不满现状而产生的积极奋进精神。这种精神状态对韩国各方面都产生着不置可否的影响。经济建设、政治参与、文学作品、传统艺术以及影视作
黑棉土是由2:1型层状结构的蒙脱石构成,且含量较高,一般可达到70%,导致其具有吸水膨胀、失水收缩的特性,且膨胀性较高。同时又具有许多其他优异的性能,包括高的阳离子交换量
随着人们生活水平的不断提高,为满足生活需求,电气设备不断增多,民用建筑电力损耗不断增加。从节能降耗角度进行分析,需要重点分析民用建筑电气系统节能设计方案,从实际情况
1992彩色片 117分钟韩国泰兴电影制片公司摄制导演:林权泽编剧:金明坤(根据李清俊的原作《西便制》改编)摄影:郑一成主要演员:吴贞孩(饰松华)金明坤(饰裕凤)金奎哲(饰东户)
<正>癫痫的精准医疗是近年来癫痫学术领域中发展最快的方向。在癫痫中,40%以上的癫痫与基因异常有关。近年来,随着越来越多癫痫致病基因的发现,使癫痫的精准医疗成为可能。基
会议