【摘 要】
:
在互联网快速发展的今天,研究如何高效准确的对不断膨胀的文本数据进行处理,从中挖掘出潜在的情感倾向信息,已经成为了自然语言处理领域中重要的研究任务之一,具有重大意义和应用价值。在情感分析任务中,由于传统方法存在一些缺点,基于深度学习方法得到了快速的发展并成为主流。当前存在着很多高质量的情感知识和语言资源(如情感词汇,否定词,强度词)在传统情感分类方法中起着至关重要的作用,但是这些高质量的情感知识和语
论文部分内容阅读
在互联网快速发展的今天,研究如何高效准确的对不断膨胀的文本数据进行处理,从中挖掘出潜在的情感倾向信息,已经成为了自然语言处理领域中重要的研究任务之一,具有重大意义和应用价值。在情感分析任务中,由于传统方法存在一些缺点,基于深度学习方法得到了快速的发展并成为主流。当前存在着很多高质量的情感知识和语言资源(如情感词汇,否定词,强度词)在传统情感分类方法中起着至关重要的作用,但是这些高质量的情感知识和语言资源在最近的深度神经网络模型(如Bi LSTM)中很少受到关注,没有被充分的利用起来。另外,可以看作是一个序列建模任务的情感分析存在着解码序列长度问题,序列长度的大小会影响到最后文本情感分类效果。针对这两个问题,本文使用了专门用于序列建模并具有上下文语义捕获能力,可以将之前记忆的词语应用到当前语义下等特点的双向长短期记忆网络(Bi LSTM)模型,用来作为构建情感分析模型的基本模型。本文主要进行了以下研究:1)本文通过在序列Bi LSTM模型上建立多个通道特征向量输入,来充分利用这些语言资源。还提出了一种自注意力机制,将多通道特征输入向量和Bi LSTM模型的隐藏层输出相结合,用来缓解文本的解码序列长度问题。最后,分别在中文数据集COAE和英文数据集MR、SST-5、SST-2上进行了实验,表明了本文提出的MFSA-Bi LSTM模型在分类准确率上优于其他基准模型,并且模型能够在一定程度上缓解文本序列长度问题。2)在MFSA-Bi LSTM模型的基础上,本文提出了MFSA-Bi LSTM-D模型,专门用于文档级文本情感分类任务。最后在两个文档级英文数据集YELP3和IMDB上进行了对比实验,表明了MFSA-Bi LSTM-D模型在分类效果上优于其他情感分类基准模型,而且比MFSA-Bi LSTM模型更适合文档级文本情感分类任务。
其他文献
为了解决风险度量的不确定性等问题,次线性期望的理论被提出并成为了经典概率理论研究发展的一个新趋势.本论文将经典概率空间中的极限理论推广到了次线性期望空间,建立了次线性期望空间下负相依(ND)随机变量序列加权和的完全收敛性和几乎处处收敛性以及广义负相依(END)随机变量阵列的完全积分收敛性.首先,我们将概率空间中的完全收敛性定理作为理论依据,再结合次线性期望空间下ND随机变量序列的负相依性,以及次线
项目管理,风险管理等概念均起源于美国,并于之后引入国内,经过国内一段时间的发展,逐渐形成一套适应我国国情的项目管理理论体系。这套理论在初期更适用于工程项目的管理,但是随着科技与时代的进步,我国信息化建设工作的深入推广,信息化与工业化融合的需求逐步增强,越来越多的信息化项目需要用到项目管理领域相关知识与能力,不同类别的信息系统的安全稳定运行将直接关系到企业秩序与国计民生。与此同时,在网络科技的发展下
在过去的几十年中,数字图像处理和网络通信的发展引人注目。它们产生的直接影响就是提高了对互联网和无线网络进行实时安全的图像传输的要求。因此,为了应对这一挑战,密码学者们提出了各种各样的图像加密方案。在众多的方案之中,基于混沌的图像加密算法取得了尤为显著的成就。这是因为这类加密算法在安全性、复杂性、速度、计算能力和计算开销等方面都表现出了非常出色的性能。此外,基于混沌的加密技术可以对图像数据进行快速地
工业机器人技术水平是一个国家工业自动化水平的重要标志之一,随着社会生产和科学技术的发展与进步,中国机器人行业正处于井喷时期,中国已经成为全球机器人增长速度最快的工
越南是一个正在发展的国家,由于近年来越南经济的稳步发展,电子商务和网上购物的普及,使得快递行业在越南也到达了其发展的良好时期。目前快递服务供应商在越南可分为三大类:国营快递企业,私营快递企业以及国外引进的快递企业。越南快递服务供应市场除了面临由国外引进的巨头快递企业带来的挑战外,还存在越南国内的各个快递企业之间的剧烈竞争。因此,越南快递企业应该加速地提升自己的竞争能力,这也使得快递企业在其竞争战略
东北红豆杉(Taxus cuspidata)是我国珍稀濒危植物和极小种群保护物种,也是提取抗癌药物紫杉醇的珍贵植物资源,因此东北红豆杉的保护和利用备受关注。目前有关东北红豆杉的研
作为一种比语音和文字更丰富的信息载体,视觉数据是人们获取信息和理解世界的主要方式,拍摄和分享高质量的图像也成为了我们日常生活不可或缺的一部分。高质量的图像是给人以舒适的视觉体验、传递清晰完整信息的基础。然而,由于光照条件的限制、成像系统的缺陷、传输压缩的损失、显示设备的错配,加之拍摄技巧有限和物体的运动等原因,在图像的实际获取、处理、传输和显示等各个环节,都会不可避免的引入失真。如何建立自动准确的
酒篓岽银(金)多金属矿床位于“钨都”赣南地区于都银坑-宁都青塘贵多金属成矿带上,该成矿带是赣南钨矿矿集区最为重要的贵多金属成矿带,分布于宁都—安远深大断裂西部。于都
石墨烯与纳米金属粒子的复合材料作为极具吸引力的二维形态碳基材料石墨烯的衍生物,其兼具二维石墨烯和纳米金属粒子的性能优点,因此能量储存、柔性材料、光电催化方向有着广
极光是由携带有高能带电粒子的太阳风在与地球磁场和大气层相互作用过程中产生的发光现象。因其独特的成因,极光现象的背后隐藏着大量极区日地相互作用和地球大气层活动的相关信息,同时极光形成和发展过程中在电离层中产生并传播的大量能量又会给通信等人类活动造成干扰。所以对极光现象的观测和分析对研究日地间作用和极区大气层活动有着重要意义,掌握极光现象发生的规律,还可以有效降低极光对人类活动的影响。我国在南北极的多