论文部分内容阅读
在电商网站不断增加的时代,用户的评论信息也在不断的增多。用户通过浏览某个产品的网络评论得到数据支持服务,借此深入了解产品,并在用户决策时提供参考;商家通过挖掘用户的反馈意见,指导后续改进产品和服务的质量。关于网络评论的意见挖掘技术得到广泛的研究。意见挖掘中评价对象的抽取是很多研究者关注的问题,其中明确表达评论属性的显式评价对象获得了较多研究。包含隐式评价内容的用户意见挖掘为用户和商家提供了更加丰富的评论意见。因此,本文结合隐式评价内容对用户意见挖掘技术进行了研究与应用,主要工作如下:1)提出了显式评价对象与评价词抽取方法。根据评价对象抽取任务的粒度不同,可将其整理为语料级别和语句级别的抽取。针对语料级别的抽取任务,本文提出一种融合语义依存关系和BTM的Biterm*Topic Model语料级别评价对象抽取模型;针对语句级别的抽取任务,本文提出了基于BiLSTM-CRF与不同权值的词嵌入向量和词性嵌入向量相结合的Weight~N-BiLSTM-CRF语句级别评价对象抽取模型。使用不同的抽取模型抽取出不同级别的文本中的评价对象与评价词。2)针对意见挖掘中的隐式评价对象的预测和情感极性判别,提出了基于多输入卷积的长短期记忆神经网络的分类算法。该算法将词语及其对应的词性标注信息进行向量化,并将向量化结果作为卷积神经网络的输入;利用卷积神经网络对输入信息进行特征提取,并生成特征矩阵;利用长短期记忆神经网络对特征矩阵进行特征学习。设计实现了将该算法应用于隐式评价对象的预测和情感极性判别。实验表明,采用Weight~N-BiLSTM-CRF模型能够提高显式评价对象和评价词抽取任务的F值;基于多输入卷积的长短期记忆神经网络的分类模型比单输入卷积的长短期记忆神经网络的分类模型在隐式评价对象的预测以及情感极性的判别在准确率与F值上都有所提高。