【摘 要】
:
命名实体识别是指将非结构化文本中的命名实体进行定位和分类为预先定义的类别,它是自然语言处理中一项至关重要的基础任务,被应用到了很多高级别的自然语言处理任务之中。在农业信息化时代,互联网上储存着大量的非结构化农业文本,如何将这些杂乱无章的农业文本转化成高质量、结构化的农业信息和农业知识,是实现智慧农业的关键。因此,农业领域命名实体识别是一个非常有研究意义的课题。本文主要研究如何利用神经网络模型从农业
论文部分内容阅读
命名实体识别是指将非结构化文本中的命名实体进行定位和分类为预先定义的类别,它是自然语言处理中一项至关重要的基础任务,被应用到了很多高级别的自然语言处理任务之中。在农业信息化时代,互联网上储存着大量的非结构化农业文本,如何将这些杂乱无章的农业文本转化成高质量、结构化的农业信息和农业知识,是实现智慧农业的关键。因此,农业领域命名实体识别是一个非常有研究意义的课题。本文主要研究如何利用神经网络模型从农业文本中识别出与农业领域有关的9类命名实体,并且从识别效果、模型训练时间、模型解码时间和显存占用等多个方面来分析所提出模型的优缺点。本文的工作内容和创新点可以总结为以下三点:(1)本文首先选择目前比较流行的(Bi-directional Long Short-Term Memory,BiLSTM)双向长短期记忆网络与条件随机场(Conditional Random Field,CRF)相结合的神经网络架构作为基准模型,然后对其进行优化改进,提出了一种基于稠密连接的深层BiLSTM模型——DC-BiLSTM,并引入了注意力机制对文本中的实体片段进行关注,加大实体部分特征和非实体部分特征的区别,使实体部分相对于非实体部分更加的‘突出’,方便CRF对于各个字符标签的预测。(2)提出了一种基于深层注意力机制的命名实体识别模型——Deep Attention,将BiLSTM和多头注意力机制相结合,BiLSTM用来获取上下文之间的关联,使得特征向量具有时序性;利用多头注意力机制来学习不同子空间的特征信息,将词义、句法和不同层次的语义特征映射到多个多维向量空间中。实验结果表明Deep Attention模型在识别效果、模型训练时间、模型解码时间和显存占用等多个方面都取得了较优的效果。(3)本文将三种命名实体识别模型集合在一起,设计并开发了一个命名实体识别系统,并且详细介绍了其中的模型训练模块、模型测试模块、命名实体识别模块等。该系统对用户输入的文本进行自动识别,从中抽取出与农业有关的命名实体,最终通过网页的形式展现识别结果。
其他文献
自上世纪八十年代REBCO系列的高温超导材料发现以来,因其大的磁悬浮力、强的磁通捕获能力、高的临界电流密度和其大尺寸的能力,对能源、交通、磁体及其相关高新技术产业的升
随着我国化工行业的快速发展,许多先进的管理理念及管理模式被应用于国内化工企业,如以作为动态控制管理过程的目标成本管理就不断被诸多企业实践并认可。目标成本管理以企业
氮、磷是植物生长发育所必需的两种营养元素,它们供应不足会显著影响作物生长及其产量,研究表明如果氮磷供应不足就会严重影响植物体内正常生理生化活动。植物根系根尖处的根
冰川是气候变化的天然指示器。冰川物质平衡是联结冰川波动与气候变化的关键因子,是冰川对气候变化的直接反应。因此开展冰川物质平衡的观测与模拟,进行物质平衡与气候要素关
目的:研究脂联素(adiponectin,ADPN)对小鼠背根神经节(dorsal root ganglion,DRG)中T-型钙通道电流的作用和机制。方法:应用Western Bolt及免疫荧光方法检测小鼠背根神经节上ADPN受体亚型的表达和分布情况。应用电生理和分子生物学的方法,研究ADPN对小鼠小直径DRG神经元T-型钙通道亚型电流及兴奋性的作用。同时,通过药理学方法研究其信号通路和作用机制
非线性方程求解问题不仅在应用数学领域占有重要的地位,同样地,在计算机科学、化学和物理学领域也有广泛的应用,该问题的研究极大地促进了数学与计算科学的融合和发展.本文基
坐标下降法在优化问题中扮演着非常重要的作用.本文基于GSL规则提出了一类改进的坐标下降法来求解无约束优化问题.首先,本文利用GSL规则的乘法扰动所确定的指标集和一种新的
上市公司“高送转”是一种独特的分红方式,虽然对公司的经营能力没有任何改变,但是总能引起市场的关注,使股价出现短期内的上涨;然而这种没有实质意义的分红方式往往掩盖了上
在牙克石地区开展详细的1:25万区域地质调查工作时,发现有两种不同成因类型的基性侵入岩出露:Ⅰ类沿乌奴耳—头道桥断裂带分布,呈残留体、断块的形式产出,主要岩性为辉长岩、
作为第三代宽禁带半导体材料的代表,氮化铝(AlN)晶体具有宽带隙,高击穿电场、高热导率、高电子饱和速率以及高抗辐射能力等优点,在高温、高频、高功率电子器件的制备方面具有