基于文本的情绪检测研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:cs333333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的日益繁荣,在线新闻网站、博客等社交网络平台成为人们分享自己的感受、态度和观点的主要方式。因此,涌现了海量的用户生成文本。准确地分析和检测这些文本中的情感,利用计算机来感受、理解以及识别人类情感可以增强对用户情感状态的理解,有着十分重要的意义。基于文本的情绪检测的主要任务是检测文本中包含或者触发读者的细粒度情绪。基于文本的情绪检测被广泛应用于人机对话,推荐系统以及舆情监控等应用中。因此,基于文本的情绪检测技术研究具有重要的现实意义和应用价值。现有的文本情绪检测方法大多只检测文本的单个情绪,而现实生活中的文本通常包含或激发多种不同的情绪,并且情绪之间还存在强度差异。因此,对文本中的多个情绪进行检测和排序是至关重要的。本文围绕相关情绪排序(Relevant Emotion Ranking,RER)学习进行研究。本文的主要贡献有:1.文本可能包含或激发具有不同强度的多种情绪。因此,检测一个给定文本相关的多种情绪可以看成一个多标签分类问题。本文更进一步对文本的相关情绪进行排序。很显然,排名靠前的情绪与文本的关联性比排名靠后的情绪更为密切,而不相关情绪的排名并不重要。针对这一特点,提出了一种新的相关情绪排序学习框架RER及对应的学习算法。在该框架中,设计了新的损失函数,实现了对情绪的检测和对相关情绪的排序。此外,通过观察,我们发现一些情绪共同出现的频率更高,而有些情绪很少共同出现。于是进一步将该情绪共现信息作为约束条件引入到学习框架。在两个真实语料库上的实验结果表明,RER能有效地处理情绪检测问题,其性能优于现有的情绪检测方法和多标签学习方法。2.情绪可能是由文本中隐含的主题触发的。因此引入并揭示主题信息可以帮助我们理解情绪是如何触发的,进而有助于准确的情绪检测。于是进一步提出了一种基于主题可解释的神经文本情绪检测(Interpretable Neural Network for Relevant Emotion Ranking,INN-RER)模型进行相关情绪排序学习。借鉴迁移学习的思想,首先根据主题模型生成的主题分布初始化神经网络,使得神经网络的隐藏层模拟主题模型的行为,即学习文本中的隐含主题信息。此外,使用相关情绪排序损失函数对整个神经网络进行优化。在三种真实语料库上的实验结果表明,INN-RER的性能优于现有的情绪检测方法、RER以及多标签学习方法。此外,学习到的模型INN-RER具有良好的可解释性,所提取的情绪关联主题词可明显反映触发该情绪的主题或事件。3.现有的文本情绪检测方法或基于浅层表示,例如词袋模型,存在未考虑单词词序的问题,或基于深层语义表示,例如循环神经网络,但在捕获长距离依赖性方面存在问题。本文提出了一种基于层级状态的神经文本情绪检测模型(Hierarchical State Recurrent Neural Network,HSRNN)用于相关情绪排序学习。相对于传统的循环神经网络那样增量地读取一系列单词,层级状态循环神经网络在每个时间步同时对所有单词或句子的隐藏状态进行编码,以更好地捕获长期依赖性。此外,采用层级机制来捕获文档中关键的层级语义结构。在两种文档级别的真实语料库上的实验结果表明,HSRNN的性能优于现有的情绪检测方法、INN-RER以及多标签学习方法。此外,层级机制可以捕获文档的关键层级语义信息,动态突出文本中唤起情绪的重要部分。
其他文献
背景:作为一种致死率、恶性程度均极高的肿瘤,胰腺导管腺癌以易转移、放化疗收效低、预后极差等为显著特征。近年来的多项研究已表明,在胰腺癌的肿瘤微环境中存在的大量间质
本文以多种药物为研究对象,对它们进行化学改性或剂型探索以实现高效、低毒、无污染的缓、控制剂。首先,我们合成了pH敏感单体HBG、HBO和光敏感单体4-AAB,并以介孔硅为药物载
本文结合固支直杆三点弯小试样和圆环试样的优点,提出了一种新型的固支C型环小试样测试方法。这种小试样体积小、加工简便、应用范围较广,尤其对于换热器管、高温管道等管状
公交站点选址是城市公交站线规划中的重要一环,选址方法及选址结果均对公交线路运营有极大影响。灵活公交作为一种新兴公交系统,在提高公交线路可达性、满足不同区域乘客出行
在继高性能、高强混凝土之后出现了一种新型建筑材料,其耐久性能和力学性能都非常优越,称为活性粉末混凝土(Reactive Powder Concrete,简称RPC)。RPC基材的激发剂、配合比、纤维的体积掺量以及养护制度是影响RPC力学性能的四个主要因素。为提高RPC的综合力学性能,本研究对以上四个因素做了充分的研究。本实验通过(L934)正交试验分别确定了单掺粉煤灰或单掺矿渣粉的RPC基材最佳配
随着煤炭开采强度的不断加剧,急倾斜煤层产量的逐年增大,西南地区中小型矿井如何安全、高效开采地质构造复杂、难采的薄及中厚急倾斜煤层已成为西南地区保障电煤供应、煤炭行
效应代数是量子逻辑理论中一种重要的代数结构,许多学者用不同的方法对其结构进行了研究,其中黏合技巧是研究效应代数的结构的重要技巧之一.早期,RJ.Greechie通过布尔代数的
中国票据市场发展至今已有将近四十年的历史,票据市场总体规模的扩大以及参与主体的多元化,为中小企业提供了相对较低成本的融资渠道支持,有力地促进了实体经济的发展。但与
设L(m,n)是特征零的代数闭域上的模型线状李超代数.本文首先给出了L(m,n)的几类特殊的Z2-齐次超triple导子,并证明了它们的线性无关性.随后证明了L(m,n)的任意一个超triple导
GaN基半导体材料具有禁带宽度大、电子饱和速度高、击穿电压大等良好的电学性能,在微波大功率和高压开关电路领域具有很大的发展潜力。可靠性问题一直制约AlGaN/GaN HEMT器件发展,在一些特殊的工作环境中,HEMT器件稳定性关系着整个电路系统的安全问题。本文针对常规耗尽型AlGaN/GaN HEMT器件,从仿真和实验两方面进行电应力和辐照应力的可靠性研究。本论文主要工作总结如下:1.使用Silv