基于深度学习的文本情感倾向性分类研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:dustfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的快速发展,电子商务也呈现出日益昌盛的形势。用户在平台上购买过所需要的商品后会对此作出评价,这些评价中包含着用户对商品的主观情绪,因此对这些评价进行情感倾向性分类和判断,在学术和商业上都具有关键的作用。在以往的该领域的研究中,对于文本的情感倾向性分类一般会运用到情感词典的方式,或者传统的机器学习的方式,但这些方法都已经无法适用于当前网络环境所产生的海量文本以及文本中包含的复杂语义信息中,因此越来越多的学者使用深度学习技术进行文本情感倾向性分类的研究。本文将深度学习技术中的CNN,以及循环神经网络的变体LSTM运用到相应的倾向性划分研究中,对于目前的分类方法来说,文本描述通常缺乏对文本上下文环境的分析、忽略词语本身所具有的特征以及未考虑传统的语言学规则。针对上面的问题,分别提出了多通道的CNN情感分类模型和融合语言学规则的LSTM情感分类模型,取得了比较好的效果,具体工作如下:(1)提出引入注意力机制的多通道CNN(multichannel convolutional neural network with attention mechanism,ATT-MCNN)分类模型。目前的文本表示模型比较缺乏对文本上下文环境的分析,而且未考虑文本中的词语本身所具有的特征,从而丢失了词语中所包含的情感信息。本文提出了引入注意力机制的多通道CNN文本情感分类模型,它充分利用了句子中的情感词信息,考虑到词语本身的结构中所包含的情感倾向信息,通过输入层的多个不同通道,将词语的结构信息融入到文本表示中,提升了模型的准确率。通过实验发现,采用多通道进行文本输入时,相比于传统的CNN文本分类模型,其准确率可提升2.75%。(2)提出融合语言学规则的LSTM(linguistically regularized lstm,LR-LSTM)文本情感分类模型。将传统的语言学规则融入到长短期记忆网络中,充分融合句子在时间序列上的特征以及句子结构中本身所包含的语言学规则,提升了模型的准确率,实验表明融合语言学规则的文本倾向性分类模型取得了比较好的效果,相比于以前的LSTM文本分类模型,其准确率提升了4.1%。(3)在上述研究的基础之上,本文还完成了基于深度学习的情感态度的划分系统的创建以及实现过程。对于此类分类系统进行了需求分析,并设计了相应的功能以及模块,实现了数据采集、文本预处理以及文本情感倾向分类的自动化处理。
其他文献
油菜(Brassica napus L.)是我国种植最广泛的油料作物之一,它不仅可以生产食用油,而且其饼粕富含蛋白质,也被广泛用于动物饲料。角果开裂是植物生殖发育的一个重要生理过程,开裂过程中,成熟的种子释放,后代生存范围得以扩大,自身繁衍得以实现。随着社会经济地发展,人们对菜籽油的需求量及质量要求越来越高,通过提高机械化生产水平来提高油菜种植的生产效率成为现代农业地迫切需求。在油菜生产中,角果开
酿造食品是人类利用发酵过程通过生物催化剂加工制造的一类食品。传统酿造食品在我国拥有漫长的历史,因其具有独特的风味,丰富人们的饮食生活,深受广大消费者的喜爱。近年来,人们对食品品质的要求逐渐提升,传统酿造食品的品质检测包括重要组分的定量测定及风味的评价。目前,组分的定量测定主要依靠大型食品仪器分析技术,但样品的预处理往往比较繁琐,且样品检测费时费力。风味的评价主要依靠人工感官品评,该方法存在主观性强
在全球,非酒精性脂肪肝病(Non-Alcoholic Fatty Liver Disease,NAFLD)和非酒精性脂肪肝炎(Non-Alcoholic Steato Hepatitis,NASH)的发病率和患病率急剧上升,NASH可以发展为需要移植的终末期肝病和肝癌,大大增加了全球医疗系统的负担,因此迫切需要有效的治疗策略。但目前为止,美国食品药品监督管理局(FDA)尚未批准任何药物可用于治疗N
实验目的:本文主要研究同源盒家族中的Homeobox C6(HOXC6)在胶质瘤中的表达水平和高表达HOXC6的胶质瘤患者预后生存情况,继而研究HOXC6基因对胶质瘤U251、U87细胞增殖和迁移的影响,最后研究HOXC6基因对胶质瘤U251、U87细胞上皮-间质转化的影响。实验方法:在胶质瘤相关网络数据库上,分析HOXC6基因在胶质瘤细胞中的表达水平以及HOXC6基因表达高低与患者预后生存情况的
僵蚕(Bombyx Batryticatus)为蚕蛾科昆虫家蚕Bombyx mori Linnaeus 4~5龄的幼虫感染(或人工接种)白僵菌Beauveria bassiana(Bals.)Vuillant而致死的干燥体。文献考证要求僵蚕具有以下品质:“大而无蛆”“条直/条粗”“质硬”“折断腹内黑而光亮”。近年来,僵蚕的需求量逐年增加,市场上出现石灰水拌僵蚕、增重僵蚕、绿僵蚕、黄僵蚕、鼓炒僵蚕等
当前我国戏曲面临着很多时代性的转变,新媒介载体的飞速发展和大基数的使用群体为戏曲的数字化保护和传播提供了新机遇。作为越剧流派之一的竺派在保护性发展的过程当中遇到诸多困难和问题。针对当前南京竺派越剧保护研究存在的问题,本项选题旨在初步建立一套针对竺派越剧数字平台界面设计的方法和思路,以期对竺派越剧文化的科学保护和发扬传播提供一些理论参考。本课题在对戏曲数字化保护和界面设计相关理论综述的基础上,从艺术
木质素是由苯丙烷单元通过不同类型芳醚键和碳碳键连接构成的高分子聚合物,其储量仅次于纤维素是世界第二大生物质资源。自然界中存在多种生物可以高效降解木质素,如真菌、细菌等。细菌具有良好的环境适应能力,能够耐受极端环境和较易基因工程改造等特点,在木质素生物降解方面起着重要作用。近年来有研究表明,部分细菌体内拥有“生物漏斗”代谢途径即可以通过多条木质素代谢途径将不同的木质素解聚酚类化合物汇集到一个共同的中
微拟球藻中含有丰富的蛋白质、油脂、粗纤维和微量元素,其中粗纤维含量约20%。在工业规模上从微藻类提取脂质后会产生大量藻渣,通常作为工业废料丢弃,产生环境污染和资源浪费等问题。为了开发利用这一资源,本研究以微拟球藻藻渣为原料制备膳食纤维,采用超声辅助碱法,通过单因素试验和响应面分析法优化微拟球藻藻渣膳食纤维的提取工艺。比较U-SDF(超声辅助碱法制备的可溶性膳食纤维)与A-SDF(碱法制备的可溶性膳
为了减少玉米加工副产物玉米粉的浪费,提高其利用率,本研究以玉米粉蛋白为原料,通过多频超声辅助固定化酶膜耦合的方式制备玉米ACE抑制肽,以期提高玉米肽的产量和活性。同时从分子水平探讨了多频超声处理和酶解反应对蛋白质、固定化酶和产物肽的影响。此外通过将近红外光谱技术与化学计量学方法的有效关联,建立了多频超声辅助固定化酶膜耦合制备玉米肽过程的近红外光谱预测模型,实现了对产物肽浓度和ACE抑制率的原位实时
随着我国经济的不断发展,其伴生的环境问题已经变得不可忽视,它不仅阻塞城乡发展,也影响居民的生活质量。近年来,公共自行车在我国各个城市点的运营发展,使得绿色出行的观念深入人心,但潜藏于其中的问题也逐渐显现出来,“借车难,还车难”已经成为当前研究中亟待解决的问题之一。对当地公共自行车系统进行用户需求预测,可以将用户的需求状况反馈到系统内部,从而提高公共自行车系统的调度效率,进而使得居民“借车难,还车难