基于注意力机制的中文微博立场检测模型

来源 :武汉大学 | 被引量 : 1次 | 上传用户:zhouqin1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的快速发展,用户每日在网络上产生了海量的数据,这些数据无疑均蕴含着极大的价值,与此同时针对社交网络数据挖掘其中蕴涵的立场倾向逐渐成为重要的研究方向。第五届自然语言处理与中文计算会议(NLPCC)在2016年提出了针对中文微博的立场检测任务,成为了一个新的研究课题。已有的立场检测任务工作中,研究者主要通过手工构建特征、添加情感词典和专家知识等资源的方式来获得有价值的语义特征。但是这种方式需要耗费大量人力在特征设计与机器学习模型训练方面,且最终的效果与特征设计的质量和模型参数的调优息息相关。于是一些研究者使用深度学习技术来学习文本特征并取得了不错的效果。考虑到针对中文微博的立场检测任务,中文微博本身的长度有所限制且包含较多的网络用语、表情符号等非规范文本,从而导致微博文本可以容纳的信息有限。同时发现微博中有时一个词,或者几个词就能大致反映出其整体立场。如何从有限的微博信息中获得能够表现立场信息的语义特征是本文研究的重点。基于以上的认识,本文提出了一种基于注意力的BiLSTM-CNN中文微博立场检测模型。模型主要分为两个部分,首先在句子表示方面,本文使用多种分词模型对微博文本进行分词,从而减少了因为单一分词模型产生的噪音干扰。并且在已有的研究工作中发现,句子的情感倾向对立场倾向有一定程度的影响,所以本文将句子的情感倾向作为特征与多种分词模型获得的词序列相结合,最终获得了基于多种分词序列的多特征句子表示。其次是构建深度学习模型方面,本文基于卷积神经网络(CNN)构建了中文微博立场检测模型,在其基础上为了解决传统池化策略存在信息丢失的问题并尽可能从信息稀疏的微博文本中提取出有价值的立场特征,本文基于卷积神经网络(CNN)的立场检测模型的基础上,提出了基于注意力的双向(Bi-directional)长短期记忆神经网络(LSTM)和卷积神经网络(CNN)混合网络立场检测模型,基于注意力的池化策略使得微博中重点词和特征得以凸显的同时改进了 CNN的传统池化策略。本实验使用了 NLPCC2016提供的任务语料和评估标准。实验表明,本文提出的基于注意力的BiLSTM-CNN混合网络模型针对中文微博能够有效挖掘其中蕴涵的立场信息,并获得了不错的表现。
其他文献
在我国的装配式建筑发展计划和相关政策引导下,装配式建筑注定会成为建筑行业未来快速发展的一个趋势。叠合水平构件的应用范围较为广泛、研究较为全面,主要适用于跨度小、竖
黑洞的微观结构是什么?在真正的量子引力理论建立前,也许不会有最终的答案,但从热力学及相变的角度研究黑洞,也许可以为这个问题提供有用线索。正如19世纪对普通热力学的研究
水资源是社会生产生活不可或缺的自然资源,是人类生存的物质基础。改革开放以来,随着甘肃省社会经济的不断发展,人口是持续增加以及人们生活水平的日益提高,对水资源的需求量
现实生活中的许多复杂系统,比如社交网络、生物学网络、电力系统等,都可以被抽象为复杂网络模型,通过研究复杂网络的特点与结构,可以帮助我们更好的掌握与使用复杂系统,而社
致密气藏一般是指一类渗透率很低的储层,如果不采取如大型水力压裂,水平井或多分支井进行增产就无法获得经济产量或经济采收率。据估计,世界范围内致密砂岩气藏的储量约为823
随着信息技术的不断发展,计算机技术在各个领域的应用也日趋成熟完善。在铁路领域的应用中,特别是铁路生产管理如车务系统中,信息技术的应用比较广泛,但是对于机务、车辆等以
近年来,随着计算机科学、传感器技术的高速发展,对高精度定位技术的需求也愈加凸显,如无人驾驶、物联网、无人机定位、增强现实等等应用都需要对载体自身的位置和姿态进行估
昆虫病原真菌作为重要的杀虫真菌,具有对环境友好、害虫不易产生抗性、能实现对害虫种群持续控制的优点,但其防效不稳定、杀虫速度慢、生产成本高等缺点限制了其广泛应用。分
蔗糖是植物体内重要碳水化合物,不仅对植物生长发育具有作用,还直接影响果实品质。中性/碱性转化酶(NI)可以将蔗糖不可逆地分解为葡萄糖和果糖,依据进化关系可将其分为α组和
能源是人类社会赖以发展的动力。随着能源危机也开始在当代社会显现,人们迫切希望寻找到一种可替代的能源来满足人类社会未来的发展。另外,得益于微电子技术的快速发展,各种