基于图模型的文本情绪预测方法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ypf0856
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前使用神经网络对文本类数据进行语句级用户情绪预测的模型,大多采用将一整条文本数据转换为词向量形式后作为训练神经网络模型的特征,将该条文本数据对应的情绪类别作为标签这样的处理方式。虽然有些采用了长短期记忆(Long-Short Term Memory,LSTM)、门控制单元(Gated Recurrent Unit,GRU)等形式的神经网络模型将文本数据中前后位置有差距的单词关联在一起,使模型在处理文本数据时具有“记忆”功能,但文本数据中前后位置差距大的单词之间仍然存在弱关联,导致单词不能完全表示出其在文本数据中的信息。而且,由于文本数据中存在某些通用性、模糊性的单词,这些单词使文本数据的信息不能表示的十分具体、明确,所以若直接使用用户文本数据进行情绪预测,预测结果难免产生偏差。但是,在采集数据集时,采集到的文本数据往往存在其语义环境,若能够将采集到的文本数据置入其中,文本数据中的单词的意义将更加具体、明确。但目前大多数的文本类数据情绪预测模型没有将文本的语义环境考虑在内。为解决上述问题,本文为文本数据构建表示其语义关联的图模型。本文构建的图模型有两种,分别是依据文本数据集构建的语义环境图模型和依据单独一条文本数据构建的文本图模型,两种模型都是以单词作为顶点,以单词间的关联作为边的权重。这两种图模型经文本语义注入模型,通过语义环境图模型将文本图模型中的单词意义具体化。在构建文本图模型的过程中,文本数据中的不同单词会被直接关联起来,文本上下文弱关联的问题会得到有效的解决。在文本图模型和语义环境图模型结合的过程中,文本数据会被置入其语义环境中,语义环境缺失的问题得到有效的解决。之后,将单词意义具体化后的文本图模型作为特征,文本图模型对应文本数据的情绪类别作为标签训练卷积神经网络(Convolutional Neural Network,CNN)模型。CNN模型训练完成之后就能够根据用户的文本数据准确的预测用户的情绪。为评估使用图模型训练CNN模型的有效性及稳定性,本文搭建CNN模型并使用图模型进行训练,统计实验结果,从不同方面分析模型的性能。同时,为了与词向量训练的神经网络模型进行对比,本文还另外搭建了CNN模型和循环神经网络(Recurrent Neural Network,RNN)模型并分别使用词向量进行训练。三种实验模型使用相同的训练数据集和测试数据集,统计实验结果,对比分析三种模型在进行文本情绪预测任务时的性能优劣。三种实验模型的对比结果显示,使用图模型训练的CNN模型在进行文本情绪预测任务时,其准确率较使用词向量训练的CNN模型和RNN模型有所提升,但训练代价更大。
其他文献
作为一种非线性动力系统,混沌系统通常获得的系统信息具有不确定性或不完备,由于它具有一般对初始条件极端敏感、存在奇异吸引子等特点,因此一般来说很难建立精确的解析形式
目前,国内正在全方位地推进中等学校的课程改革,根据教育部中学生物课程标准(2017版)中的要求,中学课堂教学要更加强调学生的主体性地位,重视培养学生在学习中自主探究的能力、重视学生的创造性发挥,由此可见,传统的生物教学模式已经不适应新的课程理念。本文在借鉴了国内外教育家关于“目标-导控”的教学思想,以掌握学习理论、建构主义学说理论以及目标驱动理论等教学理论为基础,结合自身多年的初中生物课程教学经验
中国私募基金行业近年来发展迅猛,成为金融行业的重要组成部分,对扶持企业发展也有重要作用。本文将结合联新资本投资众为兴的案例,研究中国IPO政策对私募基金退出决策的影响
随着人们对通信的要求越来越高,第五代移动通信系统(5G)成为了研究热点,可以显著提升数据传输速率。毫米波作为5G的一个重要技术,有大量可用的频谱,可以提供更多传输带宽,而多输入多输出(MIMO)技术可以在系统带宽和总发射功率不增加的前提下,提高信道容量和频率利用率,因此毫米波与MIMO技术的结合能更好的发挥其优势,有利于进一步提高传输速率,改善系统性能。在毫米波通信系统中,视距(LOS)是毫米波通
本文首先讨论了数值域的加法性质.再从几何角度,研究了一类算子矩阵的二次数值域关于实轴,虚轴的对称性,进而验证了Hamilton算子的二次数值域关于虚轴对称.此外从α-J-自伴算
葡萄糖氧化途径是一种存在于细胞周质空间的葡萄糖利用途径。本论文对克雷伯肺炎杆菌葡萄糖氧化途径进行了研究。通过基因同源重组的方法,构建了葡萄糖氧化途径以及下游代谢
随着科学技术与社会经济的迅速发展,自动驾驶汽车在现代交通系统中展现出高度的研究与应用价值,逐渐成为未来汽车的发展趋势,但自动驾驶的安全性依旧是研究的难点。自动驾驶
随着当前社会的进步与发展,日益严重的交通拥堵问题成为了阻碍经济发展的一大主要原因。据有关报道显示,仅北京市一年因该问题所造成的经济损失就达数千亿元。因此,对于如何通过新兴的科学技术(如计算机科学、运筹学等)来解决这一交通拥堵问题以提高公共交通的利用效率变得日益重要起来。同时,对于交通流量的准确预测又是解决交通拥堵的关键因素,它通过对历史交通数据的学习来进行下一时刻流量的预测,从而提前对各类出行工具
我国乡村面积广大,分布于城市与“第一自然”之间的广大区域中,它是人类聚居繁衍的发祥地,是人类生产生活所创造的“第二自然”空间,也是现代人们所向往的美丽人居环境的典范。随着我国城市化进程的不断加快,城市化不断向乡村扩展,乡村的范围呈现逐步缩小的趋势并形成了乡村城市化的现象,乡村城市化对乡村人口转移、乡村产业转型、基础设施完善等方面产生了积极的影响,同时也改变了乡村景观原有的风貌,美丽人居环境的乡村也
学位