论文部分内容阅读
文本情感分析作为自然语言处理领域的研究热点之一,近年来受到越来越多的关注,其目的在于自动地从文本中提取和归纳主观情感信息。现有的文本情感分析方法主要可以分为基于情感词典的方法和基于机器学习的方法。基于情感词典的方法严重依赖于情感词典的质量,而构建一个覆盖范围广且精确的情感词典是非常困难的。基于机器学习的文本情感分析方法依赖于构建和抽取的特征,但传统的特征表示方法都不能很好的保留文本的语义信息。随着深度学习技术在计算机视觉领域的广泛应用,深度学习模型被证明在特征提取方面有着很大优势,其中循环神经网络由于其特殊的循环链式结构,非常适合处理文本等序列数据,已被广泛应用到自然语言处理领域。本文主要研究基于循环神经网络的文本情感分析方法。本文的工作内容可以分为如下两块:1)循环神经网络在传统的情感分析任务上的应用。考虑到文本的情感极性很大程度上取决于句子中带有情感倾向性的词语,对文本中的情感词加以关注将有助于提高情感分类的效果。针对目前情感分析中的循环神经网络模型缺乏对情感词的关注,本文提出了一种基于循环神经网络的情感分析注意力模型(RNN-Attention),通过引入注意力机制,在情感分类时着重考虑文本中的情感词的影响。在NLPCC 2014情感分析数据集以及IMDB影评数据集上进行的实验结果表明,该模型能够提高情感分析的效果。2)针对目标依赖情感分析任务的循环神经网络模型。目标依赖情感分析针对给定的一个目标对象,判断句子关于该对象的情感极性。目前,大多数的情感分析方法都是针对传统的情感分析任务,即对给定的一段文本直接分析它所表达的情感倾向。使用传统情感分析的方法进行目标依赖的情感分析时,由于没有考虑目标对象的信息,会导致作出错误的判断。为了解决这个问题,本文在RNN-Attention模型的基础上进行改进,提出RNN-Attention-T模型,该模型在对文本进行建模的同时引入目标对象的信息。此外,考虑到目标对象的上文和下文对句子情感倾向的影响程度往往是不同的,本文接着提出了一种对目标对象的上文和下文分别建模的RNN-Attention-C模型。实验结果表明,与现有的目标依赖情感分析方法相比,本文所提出的改进模型能够在不使用句法解析器和外部情感词典的情况下获得较好的分类效果。