基于空洞CNN的实体级情感分析研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:sunrise617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效地分析文本隐含的情感信息是自然语言处理领域研究重点之一,其中实体级情感分析旨在推理文本中实体所传达的情感倾向,更详细地考虑了对产品、服务等实体层面的意见,具有重要的研究价值。为此,针对现有实体级情感分析模型的不足,本文从特定实体和非特定实体两种情况对实体级情感分析进行深入研究,具体如下:(1)针特定实体情况,考虑到循环神经网络效率低下以及卷积神经网络(CNN)语义提取范围受限等问题,研究了一种基于稀疏注意力的可分离空洞CNN。首先利用由语义词向量和情感词向量构成的多通道词嵌入表征编码文本和特定实体;其次通过构建可分离空洞卷积模块,采用不同扩张率的可分离空洞CNN扩大语义交互范围,从而在获取多尺度语义依赖关系的同时减少模型参数;然后根据特定实体位置信息和获取的文本语义特征,设计了用于提取特定实体情感信息的稀疏注意力机制。在多个真实数据集上的对比实验表明,该模型能以17.9 K的模型参数分别在Laptop和Restaurant数据集上获得73.57%和81.36%的分类精度,同时也证明了模型的有效性。(2)针对非特定实体情况,考虑到现有方法将实体级情感分析建模为实体提取和情感极性判别两个子任务,忽略了任务之间的互动,研究利用基于自注意力的层级空洞CNN将实体级情感分析任务转化为序列标注问题,以协同识别实体和其情感极性。该模型主要由编码模块、特征提取模块、译码模块三部分构成。具体地,编码模块将文本编码为既包含语义信息又包含情感信息的词嵌入矩阵;在特征提取模块中,层级空洞CNN和自注意力机制分别负责提取层级语义特征和捕获相同语义空间中单词间的依赖关系;译码模块则根据文本特征和标签约束规则标注文本中各单词。实验结果显示,给出模型在不依赖任何领域特征或先验信息的情况下在Review和Twitter数据集上分别取得了63.33%和72.85%的F1分数,证明了给出模型的可行性。
其他文献
实行托管经营作为一种思路选择,对于我国的国有企业改革具有重要意义。国有企业实行托管经营的难点主要表现为风险问题、制度缺陷和外部条件制约,相应地进行制度建设、市场建设
元代书画家赵雍生年的依据,来自柯九思诗句"忆昔京华陪胜集,郎君妙年才二十"(《题所藏赵仲穆〈江山秋霁图〉》)。柯九思早年经历及其与赵孟頫的关系,既可证明这首诗内容的确
皖南地区广泛发育燕山期岩浆岩,可以划分为早、晚两个阶段,年龄分别为152-136Ma和 136-122Ma.谭山岩体 是其中-个出露面积较大的复式岩体,主要发育两个侵人期次,分别以二长花
大别造山带北大别超高压变质构造单元中广泛发育混合岩。基于对罗田和岳西穹隆中混合岩的野外观察、岩相学、矿物化学和锆石LA-ICP-MSU-Pb定年系统工作,发现北大别混合岩主要
2020年,传统媒体的融合发展将进入一个关键转折点,这是在前期融媒体建设的基础上进一步深化、进入深水区攻坚的转折,核心是形成新的融媒体传播生态环境,从发布型媒体向平台型
期刊
在现代化煤矿生产中,供电系统可靠是确保矿井机械化、自动化生产的关键。为提高供电系统可靠性,对供电保护整定进行了精确计算,例举了短路电流、短路冲击电流等计算公式,以期
罗西X射线时变探测器(RXTE)在中子星小质量X射线双星中发现了千赫兹准周期振荡现象(kHzQPO)。kHzQPO的频率一般在几百到上千赫兹,其动力学时标与吸积盘最内部区域物质的运动
元代文人地位低下,大量文人无意于官场仕途,转而通过文艺创作来寄托情思,元代文人的隐逸情怀因而形成。总的来说,元代书法基本笼罩在赵孟頫一派所领导的古典主义书风之下,但
期刊
英语民族语的形成过程与英吉利民族的形成、发展息息相关并相伴始终。借助语言接触理论,从民族迁徙、战争对经济和文化的影响等角度分析中古英语的演变,不但能够厘清现代英语
对彩色混凝配合比进行设计,通过试验测试彩色混凝土3d、7d、28d的抗压强度和抗折强度,探索其相应的机理和内在规律,最终确定彩色混凝土的基本配合比。研究表明,采用硅灰石粉