基于深度学习的文本情绪原因发现方法的研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:xuanchen21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,人们越来越多地在网络媒体上阐述自己的观点,并表达自己的情绪。在这种背景之下,互联网中包含情绪倾向和观点倾向的文本数据呈现爆炸性的增长。这些文本信息具有非凡的价值,它经常包括发表人的情绪和观点,有助于人们从中提取每一个人的兴趣点与关注点。近年来,人们经常会从文本中的情感信息用于进行决策。近年来,人们还开始利用文本中的情感信息,提取情绪发生的原因。情绪原因提取主要目标使从文本中识别某种情绪表达背后的原因。本文主要研究并实现基于深度学习的情绪原因发现方法。通过深度学习的方法建立情感词与文本中的句子之间的关系,并以此识别文本中的情绪原因。在以往的研究中,基于深度学习的方法通常是去准确地获取情感词与文本中句子之间的语义相关性,并依此来识别文本中的情感原因。本文主要分为四方面内容:(1)针对目前情绪原因发现问题的语料较小,若采用一些相对复杂的深度网络,往往容易过拟合。本文采用了一种新的情绪原因半自动标注方法,扩充了一倍的数据集,并利用目前Gui提出的基于记忆网络的深度模型验证了数据有效性。(2)针对目前情绪原因发现方法只采用了互注意力机制,只考虑了情感词与文本子句之间的关系而没有考虑句子本身,除此之外,以往的模型都尚未考虑注意力权重剪枝,这就导致模型仍会保留不相关的文本,产生噪声。因此本文提出了 CAES网络,在深度模型中结合互注意力机制和自注意力机制,并利用了k-max方式对注意力权重进行剪枝。这个网络在新的实验数据集上获得了0.701的F值。(3)针对目前已有研究的建模方式,大都采用了直接分类的方式进行建模,本文提出了一种新的建模方式,把情绪原因发现方法当成一个排序问题,并利用pairwise rank方式进行建模,并利用了CAES网络的思想,构建了 ABSCNN网络,这个网络在实验数据集上获得了0.7116的F值。(4)设计并实现情绪原因发现原型系统,把本文的算法集成到原型系统当中。
其他文献
通过装备制造业对内蒙古经济增长贡献的定性与定量分析,研究结果显示:装备制造业对内蒙古经济增长绝对贡献率波动性较大,装备制造业各部门对经济增长贡献差异性较大;协整检验
以不同的杀青方式,探讨杀青工艺对柿叶绿茶感官品质的影响。结果表明:柿叶绿茶以鲜叶直接采用锅式炒青的感官品质最佳;杀青条件以150℃、3min的处理形成的柿叶绿茶感官品质最
传统人工挂号的排队时间长,已经成为社会大众对医院产生不满意的主要因素之一,而预约挂号模式则是其有效解决的方法之一。本文立足于济宁医学院附属医院的预约挂号实施情况,
通过对二维条码、金属条码、隐形条码等新型条码技术的分析,探讨了新型条码在军事物流中的应用。
目前,膜技术已经广泛应用于水处理工艺中。广大科研人员进行了很多针对膜技术在各种水利条件和水质情况下的研究。本文通过对在北京中直机关的污水处理站的膜组件的研究,证实了
目的研究分析和总结椎弓根内固定的临床定位和进钉深度的探讨。方法CT椎体重建了解人字脊的出现率,用椎弓根螺钉系统内固定,腰椎弓根人字脊顶进钉68例。结果人字脊顶出现率为
随着现代教育技术的不断发展,巧用电教多媒体技术改革小学品德与生活课教学,是有效的途径,是素质教育发展的需要。利用多媒体传递教育信息,能改变小学品德与生活课教学的封闭
以湖南某地区的饮用水源——某河流流经之处所涉3个乡镇的居民饮用水为研究对象,对水体中16种优控PAHs的质量浓度及其分布特征进行调查,并结合当地人群实际暴露参数进行健康
本文介绍苹果渣综合利用。
本文利用二次旋转回归实验设计深入探讨了不同水解条件对胰蛋白酶水解乳清蛋白的影响,建立了各主要因素参数与水解度之间的回归模型,依据该模型优化了胰蛋白酶对乳清蛋白的水