基于BiGRU-CapsNet模型的文本分类研究

来源 :陕西师范大学 | 被引量 : 3次 | 上传用户:taitaitaihaole
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术水平不断提高,互联网得到迅速发展,以互联网为纽带带动了包括商业贸易、服务业、娱乐休闲、公益等各个行业迅速发展,人们的生活方式、工作方式也产生了巨大的改变。文本作为网络信息的主要承载形式,数据量飞速增长,涉及的领域也更加广泛,例如产生了大量电影评论、新闻信息、论坛交流信息、微博评论、商品评论等涉及多个产业领域的网络文本信息。这些文本信息数据量巨大,包含丰富的信息。将这些文本进行自动分类后可以了解发布信息者的真正意图,有助于经济的发展、各个行业带头企业的方向导航、政府的决策完善。近年来,深度学习(Deep Learning)作为人工智能领域最重要的进展,在诸多领域都有着惊人的表现。大量研究表明,相比于传统的机器学习算法,深度学习中的许多网络模型都能够获得更加出色的性能。基于BiGRU模型的文本分类是目前最主流的文本分类方法,在分类效果上有不错的表现。本文尝试在BiGRU模型的基础上,采用更加适合文本分类的深度学习算法进行文本分类模型搭建,主要工作包括以下几个方面:首先对文本分类的一般流程进行了概述,包括文本预处理、文本表示、文本特征提取、文本分类训练、文本分类以及性能评估。通过对各个步骤常用方法的研究以及文本分类本身特点的分析,进一步阐述了文本分类传统方法的诸多问题与难点,为后文分类方法的选取和分类网络模型的设计奠定了基础。其次阐述了 BiGRU网络与CapsNet网络的原理以及在文本分类领域的应用。为提高BiGRU网络模型文本分类性能,文中深入研究了 CapsNet的神经胶囊工作流程与动态路由机制,分别分析了 BiGRU网络和CapsNet网络在文本分类中的优势与不足,将BiGRU网络的双向循环机制与CapsNet网络的神经胶囊与动态路由机制结合起来,构建基于BiGRU-CapsNet的文本分类模型,对文本进行分类。最后在keras框架平台上搭建BiGRU-CapsNet模型对文本进行分类,并讨论影响BiGRU-CapsNet文本分类模型性能的各种因素。从神经网络迭代次数、截取文本的长度、激活函数的选择三个方面分别设置对比实验,对实验结果进行分析,得到最优的参数与函数设置。在此基础上利用该模型对其他数据集进行分类训练,验证模型的适用性,并将相同数据集分别在BiGRU文本分类模型与BiGRU-CapsNet文本分类模型上进行实验并对比分析。实验结果表明,相较于BiGRU文本分类模型,BiGRU-CapsNet文本分类模型能更有效的对文本进行分类,分类准确率更高,而且具有更好的适用性。
其他文献
目的:探讨下肢爆发力与多方向速度的相关关系。意义:为训练提供科学的依据,提高训练效率。方法:32名北京体育大学足球专项学生为测试对象,爆发力指标分别进行测试下蹲跳、立
粉煤灰是煤燃烧过程中经收尘器收集的细灰,是热电厂排放的主要固体废弃物。目前,随着国民经济发展对电力需求的增加,大量的粉煤灰也应运而生,粉煤灰的高附加值利用,不仅能够
本文基于对我国目前失业人口的结构分析认为,我国的失业存在着由结构型向总体型转变的趋势,就业压力通过降低居民消费信心抑制了国民整体收入水平和生活水平提升。造成这种趋势
随着电子技术的飞速发展,电子元器件的高度集成化成为必然趋势。高度集成化封装模块需要良好的散热承载系统,尤其是近年来多芯片组件技术的迅猛发展对承载线路板的散热能力提出了更高的要求。超高导热陶瓷基板以其优良的导热性和气密性,成为新一代大规模集成电路的理想封装材料。从毛坯到成品,陶瓷基板通常需要进行钻孔、切割以及开槽等二次加工,尤其是需要进行大量圆孔和异型孔加工,但陶瓷材料的硬脆特性为其加工带来了极大的
现阶段在我国企业的改革中,为了增强企业的国际竞争力,正着力组建企业集团,为发展规模经济提供组织保证.虽然企业集团产生已有100多年的历史,然而对我国的企业来说仍是一个新
本文研究了带额外维的高维时空背景下的高能物理的两个问题.第一个问题涉及额外维度的探测.在文中研究了一类膜世界黑洞在膜上的吸收与辐射谱.主要计算了标量粒子与引力子的
随着云计算的发展,云主机的应用领域越来越广,大部分云计算提供商都提供了公有云下的云主机租用服务,该服务也受到了各行各业的用户的青睐,用户按需租用,并可以根据业务需求