【摘 要】
:
随着互联网的快速发展,网络上的文本数据越来越多,更好地挖掘文本数据的价值成为人们越来越关心的需求之一。文本数据挖掘领域的情感分类已经成为一个热门研究领域。本文主要研究疫情下的微博评论情感分类问题,通过深度学习模型实现智能化文本情感分类。本文在BERT模型的基础上,首先研究了特征选择方法在提高BERT模型学习效率的作用,传统的特征选择方法是在训练集数据上计算得到的,由于训练集不够全面,导致部分重要的
论文部分内容阅读
随着互联网的快速发展,网络上的文本数据越来越多,更好地挖掘文本数据的价值成为人们越来越关心的需求之一。文本数据挖掘领域的情感分类已经成为一个热门研究领域。本文主要研究疫情下的微博评论情感分类问题,通过深度学习模型实现智能化文本情感分类。本文在BERT模型的基础上,首先研究了特征选择方法在提高BERT模型学习效率的作用,传统的特征选择方法是在训练集数据上计算得到的,由于训练集不够全面,导致部分重要的词并没有被纳入到特征词汇中,使模型的效果不佳。针对文本情感分类问题,本文设计的将情感分数作为权重融合进传统特征选择的方法,有效地实现对原始特征选择算法的优化,可以增加情感词汇的权重,从而更好地表示文本的情感特征。这样得到的特征词典可以减轻对训练数据的过度依赖,可以提高模型的泛化能力,减轻过拟合现象。同时特征选择作为即插即用组件,可以根据具体实际需求来使用。其次,本文对注意力机制增加掩码操作,提出BERT-Masked Att-BLSTM模型,并设计了随机掩码和学习掩码两种掩码方案。传统的注意力机制在达到合适的深度后,随着深度增加,训练误差增加,掩码注意力机制增加了网络结构的多样性,可以有效缓解这种问题。同时掩码注意力机制也具有增广样本的效果,因为掩码之后的文本是一个不同于原始文本的数据,这样就相当于间接增加了样本。掩码注意力机制可以实现在训练样本较少的情况下达到与增加样本同样的效果。而且掩码注意力机制可以减轻元素之间过度的互相适应,提高模型的泛化能力,降低过拟合现象。并且经过掩码操作,模型将学会非完整非规范句子的分类,这个尤其在微博等网络平台的文本数据上具有现实意义。实验所使用的数据是Data Fountain平台提供的疫情微博评论数据集。实验结果表明,用特征选择算法可以使模型的学习更加集中,降低计算成本,并且本文设计的结合情感分数的特征选择方法在本文所使用的数据集上优于传统特征选择方法。本文提出的BERT-Masked Att-BLSTM模型可以更容易地从深度的大幅增加中获得精度提升,产生的结果优于传统的BERT-Attention-BLSTM模型。
其他文献
近些年,金融机构反洗钱监管标准和监管期望越来越高。本文结合近年反洗钱监管要求变化,分析金融机构面临的客户身份识别、合规成本较高、资金追踪困难等问题,思考金融机构如何根据“风险为本”原则,找准定位,从管理机制、数据采集、监控技术、队伍建设等方面,不断向监管期望目标努力,提高风险驾驭能力。
近些年来,随着医学、生物学、化学和材料学等基础科学的发展和进步,生物医用材料在诊断治疗和康复护理等医疗健康领域发挥着越来越重要的作用。医用高分子复合材料可以复合多种不同结构和功能的组分,不仅具有优异的力学性能、生理惰性和生物相容性、体内外稳定性,而且容易合成、修饰和加工制备,被广泛应用在人工器官制备、组织工程和再生医学等领域。皮肤是人体最外层的器官,具有提供保护、调节体温、与外界进行物质交换、保持
本论文主要制备了三种聚乙烯醇复合医用海绵,并研究了其性能。包括含磺胺嘧啶聚乙烯醇(PVA-SD)/聚乙烯醇(PVA)/O-羧甲基壳聚糖(O-CMCS)复合抗菌海绵、磺胺嘧啶银(SD-Ag)的聚乙烯醇/O-羧甲基壳聚糖(PVA/O-CMCS)复合抗菌海绵和载银石墨烯(r-GO-Ag)/聚乙烯醇/O-羧甲基壳聚糖(PVA/O-CMCS)复合抗菌海绵。首先,在制备PVA-SD/PVA/O-CMCS复合抗
调查高职大学生专业认同与就业期望现状,探讨前者对后者的影响。随机抽取897名高职在校大学生为被试,采用问卷调查法,运用t检验、方差分析、相关分析、回归分析等方法对数据进行统计分析,得到如下结果:高职大学生整体专业认同水平较高,大一学生显著低于大二、大三学生(P<0.01),医学类专业学生显著高于文科类、理学工学类学生(P<0.01);高职大学生整体就业期望水平中等偏上,男生的就业期望水平显著高于女
学生能否在课堂之后快速地掌握知识,课外作业练习是检验教学质量的试金石,解决"听懂了"但是不会"用"的尴尬处境。在进行解题的过程中,学生的思考能力、对知识的熟练程度以及对文字的敏感程度都会得到提升。一份优秀的语文作业的设计不仅应该达到复习、预习的效果,还应该能够有效激发学生学习语文的热情。
当今世界聚乙烯醇(PVA)的用途越来越广泛,为了满足各种不同用途的要求,国内外纷纷对PVA进行研究,以开发具有各种优异性能的PVA材料。本文在保持PVA原有性能的基础上通过物理或化学手段赋予其新的特性或对其原有的性能进行改善。主要研究内容如下:1.为了将PVA和烯丙基聚乙二醇(APEG)两种组分的优势性能互补,使材料具有更高利用价值,因此设计并利用共聚合反应制备了一种新材料PVA-co-APEG,
煤矿一直是我国经济发展的有力支持,在我国的经济发展中占有着极其重要的地位。煤矿生产一直都属于高危职业,对煤矿生产的安全保卫工作必须要给予高度的重视,其也是对我国社会生产力发展和国家民生的重中之重。同时,煤矿产业的治安保卫也是构建和谐社会、企业快速发展路径的高度保障。尤其是在我国进行煤矿企业体制变革以后,如何提高煤矿产业的保卫工作,科学构建和谐煤矿成为了目前我国急需解决的重要课题。
网络直播作为一种新兴视觉文化传播活动,通过特定的直播场景建构了一个新的社交空间。本文从对话理论的视阈出发,结合网络直播的创作传播实践,从新闻传播学视角来研究网络直播过程中传播者与受传者之间的对话性及其对话关系,并检视网络直播实践中存在的问题,最后提出推动网络直播良性发展的思考。