基于注意力机制与多元特征融合的中文文本分类方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:ruiping009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文文本分类作为搜索引擎的关键基础技术,对于高效而充分地从互联网上巨量的中文文本信息中挖掘出高价值中文文本信息,以满足社会发展的需求具有十分重要的作用与价值。文本特征的提取直接地影响中文文本分类系统的性能,是文本分类中的核心技术基础之一。通过设计、实现新型的基于深度学习的文本特征提取算法模型来更好地识别中文文本特征,从而提高系统对中文文本特征的识别能力,具有十分重要的价值与意义。论文以基于深度学习的中文文本分类为主线,对基于卷积神经网络、长短期记忆网络、注意力机制和多元特征融合等模型的中文文本特征提取算法进行了深入地研究。针对中文文本分类任务中,不同文本特征对文本类别识别贡献不同的问题,提出一种基于语义理解的注意力算法模型。通过对相邻两个时间步的文本数据的特征学习结果进一步融合与学习来产生注意力权重。针对中文文本类别识别中不同文本元素发挥作用不同的问题,提出一种特征差异强化注意力算法模型。通过生成的注意力权重,使重要的文本元素在文本识别中发挥更加突出的作用。针对重要文本特征在中文文本中位置分布分散、稀疏的问题,提出一种多元特征融合中文文本分类模型。通过将语义理解注意力算法模型,长短期记忆网络(LSTM)卷积神经网络(CNN)相结合以更加全面、细致地提取文本特征。针对中文文本重点特征在文本中分布不均匀的问题,提出一种特征强化融合中文文本分类模型。通过双层LSTM与CNN对注意力机制提取的特征逐级强化来获得包含特征信息量更丰富、更全面的文本特征。通过中文文本分类实验验证了提出的四种算法模型的有效性。
其他文献
计算机技术的快速发展和人工智能的崛起,掀起了各个领域智能化热潮,智能设备逐渐进入到日常生活当中。计算机视觉作为计算机应用和人工智能等方面的重要分支,逐渐应用到图像
伴随着通信业和互联网业的发展,个人数字化信息和数据信息,长期处于高风险状态。自上世纪60年代以来,文本密码(数字字母所构成的密码)一直作为身份认证的主要方式,此后安全研究
作为一种新型的区域观测技术,无线多媒体传感器网络(WMSN)获得了国内外研究者的高度关注。在密集部署的无线多媒体传感器网络中,不同的相机节点所观察到的视觉信息存在较大的
本课题以猴头菌为材料,通过水提醇沉法提取猴头菌多糖(Hericium esrinaceus mixture polysaccharide,HEPM),氯磺酸-吡啶法进行硫酸化修饰,得到猴头菌硫酸化多糖(Hericium esrinaceus sulfate polysaccharide mixture,S-HEPM)。对其进行分离及纯化,确定硫酸基团的取代度,分析猴头菌硫酸化多糖的糖苷键、成分及单
在逆合成孔径雷达(ISAR)探测目标的阶段性过程中,假设目标沿某个轨迹作直线运动,那么可以等效为在这段时间内目标自身的一个平动加上围绕质心的一个非常小的转动,转动导致了
汉语作为目前世界上使用人数最多的语言,语言学家对其的研究从未停止过。从最初的字处理、词处理,慢慢的向句处理、篇章处理转变,这既表明现在对于字、词处理的研究日趋成熟,
随着IP业务的迅猛增长,如何对智能光网络进行更合理的管控和更灵活的资源分配来使之高效承载IP业务成为需要考虑的关键问题。本文针对密集型业务讨论智能光网络拥塞控制问题,
在核设施退役期间,将产生大量放射性废液,这些废液将通过蒸发、离子交换、反渗透等传统处理方法处理后会产生一定量的高含盐的放射性废液。针对这部分废液,本文采用膜蒸馏技术对其进行浓缩实验研究。膜蒸馏是一种新型的蒸馏技术,其依靠疏水膜将废液和馏出液隔开,将膜两侧的温度差作为推动力,实现废液的蒸发浓缩。由于膜的疏水性导致膜蒸馏过程可以有效的截留放射性核素,所以对于放射性废液的浓缩有较大技术优势。本文从减小放
2018年以来因金融严监管叠加政府债务严监管、中美贸易摩擦以及去库存、去杠杆等因素,导致债券市场大量违约,其中民营企业债券违约最为突出,这在一定程度上降低了投资者对民营企业投资的期待和积极性,民营企业融资难、融资贵等问题更加棘手和严峻。为此,2018年10月22日,国务院为稳定和促进民营企业债券融资,重启“民营企业债券融资支持工具”,以此来支持和帮扶民营企业债券融资,鼓励民营企业通过创设信用风险缓释凭证来发行债券,在信用风险缓释工具中信用风险缓释凭证应用范围最广、规模最大
学位
荧光纳米粒子具有表面易修饰、粒径较小、发光性能好等优点,为满足荧光纳米粒子在发光器件、生物成像、生物传感器等方面的应用需求,设计可调控发光行为的荧光纳米粒子是十分必要的。将聚集诱导发光(AIE)分子引入纳米粒子后,由于分子内运动受限,AIE荧光纳米粒子具有高的荧光强度。但实现其发光行为调控通常通过多个荧光分子的组合,该方法存在荧光光谱不稳定、重复性差和制备路线复杂等问题。因此,本论文选取具有AIE