基于双向LSTM的药物相互关系提取模型

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:linkageldap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物相互关系提取是实体关系提取在生物医学领域的一个应用,对生物医学文本挖掘、药物不良反应预警和药物信息检索等多个领域具有重要意义。现有的药物相互关系提取模型大多只利用了文本自身的语义信息和句法信息,忽视了生物医学领域专业知识的重要性,也有一些方法引入了陈旧落伍的生物医学信息。在对各类文本表征进行整合的时候,现有方法只将信息简单地进行拼接,忽略了各类表征之间的关联。为了解决上述不足,本文研究基于双向长短期记忆的药物相互关系提取模型,从而提升药物相互关系提取模型的性能。为了解决现有方法中缺乏生物医学领域内知识的不足,本文提出一个添加了外部生物医学资源的药物相互关系提取模型。在将文本数据映射为文本表征时,除了词语嵌入向量、实体偏移嵌入向量,加入了一种低维分布式外部生物资源表征:概念嵌入向量。概念嵌入向量由外部专业语料库训练而来,包含了生物医学实体的语义信息。最后,将转换得到的文本表征序列输入到基于双向长短期记忆网络的深度学习分类器中,从而得到最后的预测结果。为了解决现有方法中生物医学信息陈旧和忽视表征之间关联性的不足,本文提出了一个添加用户生成内容表征的药物相互关系提取模型,模型中也提出了一种全注意力机制将两类语义表征进行融合。在表征生成阶段,添加一种由用户生成内容训练而来的用户生成内容嵌入向量作为即时生物信息的表征,然后利用一种基于注意力机制的权重计算方法,将词语嵌入向量和用户生成内容嵌入向量进行结合。最后,将文本表征序列输入到基于双向长短期记忆网络和Transformer模型的深度学习分类器中,输出药物相互关系预测标签。综上所述,本文为了解决生物医学知识缺乏或生物医学知识陈旧的问题,引入了概念嵌入向量和用户生成内容嵌入向量两类外部生物医学资源表征,验证了外部生物医学资源对于药物相互关系提取的有效性;为了解决各类表征之间的关系被忽视的问题,提出了一种基于注意力机制的表征融合方法,提高了药物相互关系提取任务的性能,克服了现有方法中的不足。
其他文献
目的:观察不同浓度的紫草大黄合剂对四氯化碳(CCl4)致小鼠急性肝损伤的保护作用.方法:采用腹腔注射CCl4致小鼠急性肝损伤为模型,测定高低剂量的紫草大黄合剂对肝损伤ALT、AST
介绍了转移印花中的升华转移印花、熔融转移印花、释膜转移印花、湿法转移印花等,并对转移印花技术中新出现的反应性涂层法、具有防染效果的转移印花以及UV焙固等新技术作了
目的:探讨牙周治疗对口服心痛定等药物导致的药物性牙龈增生疗效.方法:对34例口服心痛定导致的药物性牙龈增生患者进行牙周基础治疗和手术治疗后,进入牙周支持治疗18个月,记
国内外对服装面料的纱线抗滑移性要求越来越高.文章分析了定滑移量法测试机织物纱线抗滑移性的试验原理、操作过程及试验结果,并给出了稀薄织物、平纹府绸织物及粗厚织物缝纫
目的:探讨脾切除术对肝硬化门脉高压症(PHT)的肺脏免疫功能影响,评估保脾手术对治疗PHT的优越性;方法:对模型大鼠及脾切除后的模型大鼠的肺泡巨噬细胞进行体外细胞培养;结果:
目的:研究宫颈癌组织中层粘连蛋白(LN)的表达与肿瘤侵袭和转移过程中的关系。方法:应用免疫组化法检测层粘连蛋白在宫颈基膜中的表达并分析其与不同临床分期和不同病理分级的关系