论文部分内容阅读
随着互联网的飞速发展,人们越来越多地在网络媒体上阐述自己的观点,并表达自己的情绪。在这种背景之下,互联网中包含情绪倾向和观点倾向的文本数据呈现爆炸性的增长。这些文本信息具有非凡的价值,它经常包括发表人的情绪和观点,有助于人们从中提取每一个人的兴趣点与关注点。近年来,人们经常会从文本中的情感信息用于进行决策。近年来,人们还开始利用文本中的情感信息,提取情绪发生的原因。情绪原因提取主要目标使从文本中识别某种情绪表达背后的原因。本文主要研究并实现基于深度学习的情绪原因发现方法。通过深度学习的方法建立情感词与文本中的句子之间的关系,并以此识别文本中的情绪原因。在以往的研究中,基于深度学习的方法通常是去准确地获取情感词与文本中句子之间的语义相关性,并依此来识别文本中的情感原因。本文主要分为四方面内容:(1)针对目前情绪原因发现问题的语料较小,若采用一些相对复杂的深度网络,往往容易过拟合。本文采用了一种新的情绪原因半自动标注方法,扩充了一倍的数据集,并利用目前Gui提出的基于记忆网络的深度模型验证了数据有效性。(2)针对目前情绪原因发现方法只采用了互注意力机制,只考虑了情感词与文本子句之间的关系而没有考虑句子本身,除此之外,以往的模型都尚未考虑注意力权重剪枝,这就导致模型仍会保留不相关的文本,产生噪声。因此本文提出了 CAES网络,在深度模型中结合互注意力机制和自注意力机制,并利用了k-max方式对注意力权重进行剪枝。这个网络在新的实验数据集上获得了0.701的F值。(3)针对目前已有研究的建模方式,大都采用了直接分类的方式进行建模,本文提出了一种新的建模方式,把情绪原因发现方法当成一个排序问题,并利用pairwise rank方式进行建模,并利用了CAES网络的思想,构建了 ABSCNN网络,这个网络在实验数据集上获得了0.7116的F值。(4)设计并实现情绪原因发现原型系统,把本文的算法集成到原型系统当中。