【摘 要】
:
生物医学文本领域每年产生大量的文献、病例,这些材料中往往包含重要信息,但依赖人工处理不仅工作量巨大,并且难以保证效率。近年来,随着自然语言处理的不断发展,深度学习已经取代传统统计学方法,逐渐成为各领域的主流方法。利用深度学习技术对生物医学文本进行信息提取,一方面可以有效提高提取效率,另一方面,深度学习强大的特征学习能力能捕捉更多人工难以识别的特征,提高识别精度,强化提取能力。这对于生物医学领域发展
论文部分内容阅读
生物医学文本领域每年产生大量的文献、病例,这些材料中往往包含重要信息,但依赖人工处理不仅工作量巨大,并且难以保证效率。近年来,随着自然语言处理的不断发展,深度学习已经取代传统统计学方法,逐渐成为各领域的主流方法。利用深度学习技术对生物医学文本进行信息提取,一方面可以有效提高提取效率,另一方面,深度学习强大的特征学习能力能捕捉更多人工难以识别的特征,提高识别精度,强化提取能力。这对于生物医学领域发展有着至关重要的作用。信息提取可细分为多个子任务,包括命名实体识别与关系抽取。命名实体识别旨在标记文本中的关键信息,而关系抽取则是判断这些实体之间的联系。本文的主要的工作就是解决生物医学文本中的命名实体识别与关系抽取任务,由两部分组成。本文第一部分工作,是设计了一个并行结构的端到端模型。通过CNN与RNN的并行结构对序列进行特征提取,再通过动态注意力机制进行特征筛选,最终通过分类器生成标注序列。模型在四个数据集中都表现出了优越的性能,在其中两个数据集中甚至高出目前最好结果约2个百分点。本文第二部分工作,是设计了一个基于注意力机制的特征融合模型。通过注意力矩阵将实体与序列相结合,并通过多头合并不同编码序列,最终通过分类器预测关联概率。本文还扩展了实体序列作为模型输入。实验证明改进的可行性,模型在两个数据集中展现了最优的性能,均超过了目前最好结果近10个百分点。
其他文献
近几年,由于深度学习网络性能的不断进步,图像分割算法取得了突破性的进展,基于深度学习的图像分割算法层出不穷。虽然现有算法能较好的分割出目标物体,但在边缘细节上仍有一定的不足。而图像分割效果的好坏,往往影响着后续图像处理的任务。所以,研究出精确的图像分割算法对整个计算视觉技术的推进与应用意义重大。本文针对目前的图像分割算法对于物体的某些细长、尖锐部分分割效果不好的问题,提出了一种基于细节语义驱动的图
在机械加工中,夹具是应用广泛的夹持装备。但随着机械加工技术的迅速发展,传统的基于经验的夹具设计已经逐渐不能适应高效精密生产的需求。加工质量是影响高效精密生产的主要因素,而影响加工质量的直接因素又是工件的位置偏移。为此本文针对刚性件,建立了多目标的工件位置偏移模型,提出了改进后多目标进化算法对其进行优化,以此寻得更加合理的夹具布局。本文以减小刚性件的工件位置偏移量为目的。分析了装夹布局的合理性,包括
由于钢丝绳在发生疲劳断裂时前兆特征不明显,在工程应用中存在一定隐患。为保证钢丝绳在使用过程中的安全性和可靠性,对其疲劳失效过程进行分析研究,并探寻一种科学合理的钢丝绳寿命预测方法,具有重要的理论价值和实际意义。本文以6×31WS+FC钢丝绳为研究对象,对其受载时的力学特性进行了分析计算。在此基础上对场强法进行了改进,利用改进场强法预测了钢丝绳的疲劳寿命,并通过了相关试验对其寿命预测能力进行了验证和
续随子(Euphorbia lathyris L.)是一种新型的且具有发展潜力的优良能源油料植物,种子中油脂积累达60%,其油分中有30%-40%的化合物类似于石油中的碳氢化合物,是制备生物柴油的优质原料,且油中的脂肪酸以C16和C18为主,尤其是单不饱和油酸含量高达83%。二酰甘油酰基转移酶2(Diacylglycerol Acyltransferase 2,DGAT2)催化二酰甘油(DAG)形
华北落叶松是华北地区近几十年造林和荒山绿化的主要树种之一,研究不同坡向和海拔带上树木径向生长与区域气候的响应模式和机制,有助于揭示立地因子的差异性导致树木径向生长变化的内在机理。本研究在关帝山林区孝文林场和庞泉沟国家自然保护区外围4个不同海拔和2个不同坡向的华北落叶松人工林样地内采集标准木样芯,采用树木年轮生态学方法获取胸高断面积生长量(BAI)和年轮宽度指数(RWI)两个径向生长指标,分别将样木
图像的无损压缩广泛应用在对图像细节要求较高的领域。Context建模技术作为一种非常有效的估计信源概率模型的方法,常常用于对图像序列建模。但对于高阶Context模型而言,其模型中概率分布较多,且用于统计模型的信源序列有限,便不能充分训练模型中的所有概率分布,故而引起“上下文稀释”问题。而使用Context模型对多进制信源建模相较于对二进制信源建模而言,针对多进制信源的Context模型中会产生更
随着工业的发展和城市的扩张,用电需求日益增长,对电缆的输电能力的要求越来越高,高温超导电缆(HTS)的应用有望成为一条有效的解决途径。近年来,高温超导线材的生产工艺不断成熟,低温支撑技术也更加可靠和低成本,HTS的实际应用越来越具备条件。高温HTS通常需要浸泡在低温流体中保证工作温度。液氮温度正好处于HTS工作温区,并且成本较低,使用安全,是现阶段HTS内冷却流体的不二之选。波纹管具有良好的柔韧性
2004年,石墨烯的成功制备掀起了人们对二维纳米材料的广泛关注。大量研究发现二维纳米材料具有很多优异的电学性质和磁学性质,被预言可以应用于太阳能电池、集成电路及自旋器件等光电子领域和纳米器件领域。近几年来,随着人们的深入研究,二维纳米材料更多更优异的物理化学性质被人们所证实,其中以类石墨烯六角蜂窝结构为代表的二维纳米材料尤其引人注目,它们在理论和实验上已经获得了丰硕成果。对类石墨烯结构纳米材料的研
随着高速信息技术(如5G)的迅猛发展,我们逐渐进入人工智能时代,各种通信技术在不断升级和提速扩容,直接推动了传感技术的进步。智能时代依赖众多传感器将万物互联并形成下一代网络----物联网,从而将深刻改变人们的生活和思维方式。光波导传感器属于众多传感器中的一种,具有其独特的优势,是光网络中必备的传感器。本文将主要研究平面多层光波导气体传感器及其检测气体的灵敏度,通过研究为后续实际应用的可行性做准备。
粗糙集理论是处理不精确性和不确定性问题的一种工具,其从单粒度的角度描述目标概念,具有一定的局限性。而多粒度粗糙集通过多个二元关系从多个粒度来分析问题,能够处理更为复杂的信息系统。此外,基于双量化方法的粗糙集自提出以来,由于其综合考虑了相对和绝对量化信息,能够提高近似分类精度,在不确定性决策问题中受到了广泛的关注。三支决策理论对粗糙集中的粗糙域提供了合理的语义解释,并同时考虑了决策风险,使之成为不确