基于主题的细粒度情感分析研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:eyoujin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析任务能够帮助人们高效分析互联网所呈现的包含情感信息的海量文本数据,并在一定程度上帮助消费者更加高效地做出决策,故颇具研究意义。传统的情感分析任务是直接判断给定文本的情感倾向。然而,当文本中包含多个情感目标(主题词),并且对应情感倾向冲突时,它则无法对文本情感倾向做出恰当的判断。因此,针对基于主题的细粒度情感分析任务的分析与研究非常有必要。该任务不但能够将文本中的多个情感对象识别出来,同时还能判别主题词对应的情感倾向。本论文立足于基于主题的细粒度情感分析任务的两个子任务——提取主题词任务和给定主题词的情感分析任务。主题词提取任务主要工作是从评论文本中将情感对象(主题词)提取出来,而给定主题词的情感分析任务主要工作是分析评论中特定主题词的情感倾向。因此,本论文的主要工作和研究成果如下:1.本论文借助于迁移学习方法,提出了基于预训练模型学习领域信息词嵌入表达、情感信息词嵌入表达的方法,以弥补通用嵌入表达只能捕获通用语义信息的缺陷。这两种嵌入表达更加贴近提取主题词、及特定主题词的情感分析两个子任务的需求。此外,通过迁移学习,可以将大规模语料涵盖的通用语义信息、以及扩展语料蕴含的特定知识,迁移到学习的词嵌入表征中。2.针对主题词提取任务,提出了基于多维度嵌入表达和self-attention机制的主题词提取模型。self-attention机制的引入,有效解决了主题词和上下文之间长距离依赖关系捕获不充分的问题。为了解决实验数据领域相关性强的问题,模型添加了包含领域信息的词嵌入表达。此外,该模型嵌入层同时使用了通用的词嵌入表达、包含领域信息的词嵌入表达、以及单词特征共同提升模型性能。3.针对特定主题词的情感分析任务,提出了改进的基于预训练方法的模型、以及改进的基于多任务方法的模型,以解决深度学习模型在小数据集上性能受限的问题。模型通过引入门控的多重attention机制,解决传统attention机制长距离文本特征捕获不充分问题,多角度学习上下文对特定主题词情感判定的贡献度。其次,利用包含情感信息的词嵌入表达的使用,解决通用嵌入表达不包含情感信息的问题。
其他文献
合同附随义务制度有诸多值得研究的问题。本文拟对其理论体系中比较重要的问题——附随义务的概念辨析、如何认定附随义务的存在、违反附随义务的责任构成要件以及违反之造成
在图像处理、航空航天、遥感测量、现代电子测试等很多领域,要求测试仪器设备能及时保存原始测试数据,用于事后数据分析和处理。同时前端探测器性能的提高,对于各种系统存储
刑法历来被认为是国家公权力的象征,是国家的公法。政治国家一元化的体系中,法律必然以肯定和高扬国家权力为价值取向。刑法就成为了政治国家用以统治其国民的最有力的工具,
加强对人民法院往来账款的管理,有利于促进法院财务管理规范,提升内部控制水平,进一步保障案件当事人合法权益。本文就目前人民法院往来账款管理中存在的一些问题以及解决措施进
在加入WTO的大背景下,中国的资本市场已经对外开放,中国的商业银行也已经加快开始了股份制改造和上市的进程。上市商业银行兼具上市公司和商业银行的双重身份,因此具有特殊的
随着经济社会的发展,内河航运这种传统的运输方式,在节能减排、保持可持续发展等方面越来越显示出它的活力和优越性。合理地进行航道改造及提升等级,构建完善的内河航道网,提
截至2017年底,新疆风电发电量增长44.9%,达到415.3亿千瓦时,缓解了近两年新能源利用率持续走低的窘境,未来新疆风电行业将继续保持理性增长,并在结构地域布局优化、提高小时
俗话说,秋风起,蟹脚痒。当前,正是河蟹大量起捕上市的时机,为了避免集中上市而打压售价,海安县南莫镇积极引导养殖户将河蟹暂养至春节前后上市,以获取更大的利润。1.建好暂养
<正>研究目的自由式摔跤要求速度、力量、灵敏、协调等各项素质都要求有全面、良好地发展,体能训练在日常训练中成为关键一环,而如何有效地对体能训练负荷进行监控则成为科学
会议
中国社会主义市场经济蕴含着中国特色社会主义即根本意义上的中国模式的精神实质,是一种多维结构的经济模式,又是一个全方位的社会系统改造工程,但不能替代中国模式。当代中国经