基于Valence-Arousal空间的中文文本情感分析方法研究

来源 :云南大学 | 被引量 : 8次 | 上传用户:safafaffaf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析采用计算语言学的方法,可以对带有情感色彩的主观性文本进行分析、处理、归纳和推理。区别于现有类别型方法,维度型方法可以提供更为细致的情感信息。但目前面向中文的维度型情感分析方法仍然面临着诸如文化差异,缺少维度型情感词典和语料资源,现有情感词典的覆盖性差及情感分析准确度低等多个问题,设计可靠的中文维度型文本情感分析应用仍然是一项具有挑战的工作。针对这些问题,本文基于Valence-Arousal空间,研究词汇层次和文本层次的中文文本情感分析技术,主要内容包括以下三个方面。(1)针对跨语言的词汇情感标记,本文提出一种局部加权法,改进了线性回归模型,该方法对预测目标词汇周围的训练种子词汇进行加权,并降低其他无关噪音词汇的权重,解决了线性回归模型中的欠拟合问题。实验结果表明,基于局部加权线性回归方法获得了最小的预测误差及最佳的相关系数。(2)针对同语言的词汇VA值预测,本文提出一种基于社区的加权图模型,该模型使用社区发现机制进行邻接词汇的选取,并利用加权图模型改进了PageRank算法,解决了预测过程中的噪音词汇问题。实验结果显示,所提出的方法有效地减少邻接词汇中的噪音词汇数量,提高预测的效果。(3)针对文本层次的情感分析,本文提出了一种基于区域划分的深度神经网络模型。通过区域划分,模型利用卷积神经网络提取各区域中可用的情感信息,并使用长短期记忆模型进行区域间语言逻辑的序列整合,最终用于文本的VA值预测,解决了现有维度型情感分析准确度低的问题。对比实验结果表明该模型的准确度优于现有维度型分析方法和其他神经网络模型。
其他文献
2010年2月至2010年7月间解放军总医院收治1例胃间质瘤肝转移局部切除12年后合并胃癌的患者,现报告如下:
胚胎干细胞的研发需要人类胚胎作为原材料,因而国际上对该技术存在较大的争议;当慎重对待胚胎干细胞在研发中的伦理问题,尊重人的尊严,以确保技术研发在规范内良性运行。本文
“软件定义一切”的思想正在对整个行业造成深刻的影响,人类对软件的需求日益剧增,软件过程模型对于保证开发高质、高效的软件产品具有重要作用。传统软件过程建模方法存在模
目的 分析左半结肠切除一期吻合加回肠末端造瘘治疗老年梗阻性左半结肠癌的临床效果。方法 回顾性分析2014年1月至2017年6月80例行左半结肠切除一期吻合术患者的临床资料,根
本文通过调查2016-2018年间我国医调委专家咨询的现状,对专家咨询的组建、工作形式、制度、流程、文书的规范及咨询效果等等作了归纳与分析,进而指出其当前存在地区发展参差
云计算实现了人们长期以来把计算作为一种资源的梦想,它给人们带来了诸多便利,比如按需自助服务,无处不在的网络访问,快速资源伸缩,计量付费及外包计算等。其中,云计算最显著
调度问题是组合最优化领域和理论计算机科学领域中的一个重要分支,主要研究将稀缺资源分配给在一定时间内不同任务的问题,分配过程也可以理解为一个决策过程。做决策目的是优
患者女,45岁,3年前发现左乳外卜方有约花牛米大小肿物,无红肿,触之有轻微不适,月经期无明显疼痛。曾在当地医院就诊,以“左乳腺增牛”住院,给予口服“乳癖消”等中药治疗,无明显好转
目的:检测S-ECC(severe eally childhood caries,严重早期儿童龋)患儿唾液pH值、无机成分钙、磷、一氧化氮、氯、氟和免疫球蛋白SIgA、IgG的含量,分析这些成分与S-ECC发生的