论文部分内容阅读
随着互联网的蓬勃发展及智能终端的普及,网购已经成为人们生活中一种重要的购物方式。用户在各种电商购平台上发表评论、表达情感,从而产生并累积了大量亟待处理的商品评论文本。利用自然语言处理相关技术对这些评论文本进行分析以挖掘其中所包含的情感倾向是商家获取消费者反馈信息的重要途径。因此,研究针对电商评论的文本情感分析具有重要意义。根据情感分析对象粒度的大小可将情感分析分为四种级别,粒度由小到大分别是词语级、句子级、段落级、篇章级。电商评论通常包含对商品不同属性的情感倾向,因此更适合词汇级别的情感分析。词汇级别的情感分析即细粒度情感分析。本文以电商评论语料为基础,围绕细粒度情感分析涉及的评价对象抽取任务和关联评价对象情感分析任务展开研究。具体地,本文研究内容如下:(1)研究评价对象的抽取方法。本文提出了一种基于双通道卷积神经网络与双向长短期记忆网络的评价对象抽取模型CNN-BiLSTM-CRF。该模型分为三个模块,分别为双通道嵌入模块、编码模块、判别序列模块。双通道嵌入模块将评论文本转化成词向量表示并融入词性特征。编码模块使用CNN与BiLSTM两种神经网络进行编码,两种网络不同的捕获特征方式充分获取文本序列潜在的特征信息,强化模型对每个词语周围词语的特征信息提取。判别序列模块则对编码模块获取到的特征信息进行判别序列建模,最后得到最优序列。实验结果表明该模型的F1值较现有模型提高1%。(2)研究关联评价对象情感分析。本文提出了一种结合Attention机制的关联评价对象情感分析模型mCNN-AttBiLSTM。该模型首先通过多通道以不同尺寸大小的卷积核卷积提取区域特征,然后将评价对象词向量与区域特征信息融合,接着将融合特征输入至双向长短期记忆网络获取上下文信息,且增加Attention机制对BiLSTM每个时刻的输出赋予不同的权重,最后使用Softmax分类器进行情感分类。实验结果表明该模型的准确率较现有模型提升1%。(3)基于本文研究内容设计并实现了电商细粒度情感分析演示系统。