论文部分内容阅读
随着互联网的飞速发展,消费者越来越喜欢进行网上购物,各电商平台也为此开通了评价功能,方便消费者发表对产品和服务的观点。因此产生了海量含有用户情感倾向和对商品评价观点的在线评论。这些评论对消费者进行购买决策和对商家制定营销策略及产品优化十分重要。因此如何在海量在线评论中挖掘出消费者的情感倾向并在此基础上进一步挖掘出商品的关键问题已成为当前的研究热点。针对传统机器学习方法在情感分析问题上的效果还有较大提升空间及领域可移植性差的问题,本文设计了一种基于深度学习的在线评论情感分析模型。同时,在情感分析的基础上,本文利用主题模型与聚类算法对负向评论进行关键问题挖掘。主要研究如下:第一,针对传统机器学习模型严重依赖人工进行特征选择和参数调优问题,提出结合卷积神经网络及基于注意力机制的双向长短时记忆神经网络对在线评论进行情感分析。该方法可以利用卷积神经网络进行局部特征提取,也可以利用双向长短时记忆网络学习文本的序列特征,同时注意力机制还会给重要的词分配较大的权重,从而避免对分析情感无用之词的关注。在五大领域数据集的实验结果表明,本文模型对在线评论情感分类的准确性高于传统机器学习模型,F1值可以达到95%,同时也证明了该模型具有较好的领域可移植性。第二,在情感分类的基础上,针对负向评论含有丰富隐藏主题的特点,利用Gaussian LDA主题模型对负向评论进行主题挖掘。接着利用谱聚类算法对挖掘的主题进行聚类,将话题相似的负向评论聚为一类,并将各个簇的中心评论作为该类的代表评论。从而降低海量负向评论带来的信息冗余问题,使消费者和商家可以快速而全面的了解商品的关键问题。本文所提模型提高了在线评论情感分析的准确率,同时在情感分析的基础上挖掘出负向评论中所蕴含的关键问题,降低了负向评论的信息冗余问题,对消费者和商家都有一定的现实指导意义。