基于深度学习的中医文本实体关系联合抽取方法研究

来源 :江西中医药大学 | 被引量 : 0次 | 上传用户:taohua3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别和关系抽取作为信息抽取基础和核心的子任务,旨从非结构化和半结构化的文本中提取出命名实体及实体间的语义关系类型,高质量、精准的抽取结果可以为后续的知识图谱构建、信息检索、智能问答系统搭建等提供良好的数据基础。在中医药领域,中医文献作为中医传承载体,记录了证型、方剂、中药、病因、病机和治则治法等海量非结构化或半结构化的中医文本信息,随着国家为促进中医药信息化发展各项政策的提出,对这些数据的结构化处理显得越发迫切。实现命名实体识别和关系抽取两个任务传统是采用流水线方法分两步执行,第一步实体识别,第二步将上一步结果作为关系抽取的输入进行后续关系抽取操作。传统流水线方法虽然在模型选择和实验操作上较为灵活、简单,但存在3个问题:(1)导致错误累积;(2)忽略了两个子任务间的相关性;(3)冗余信息。为克服流水线方法存在的问题,实体关系联合抽取方法应运而生,充分考虑二者的相关性,使命名实体识别和关系抽取两个任务的性能得到提升。然而现存联合抽取方法同样面临一些问题:(1)无法解决实体重叠的问题;(2)依赖人工标注语料,耗费人力物力,语料利用率不高。鉴于上述问题开展本文的工作,主要内容有:(1)结合中医文本的特定领域特点,使用改进后的序列标注策略,构建中医文本的实体关系联合抽取语料库,为中医文本实体关系联合抽取任务提供高质量的标注数据。(2)提出了一种基于字词向量并联的中医实体关系联合抽取方法。该方法使用字词向量并联拼接作为双向LSTM-CRF输入,利用双向LSTM强大的特征提取能力,以及CRF在序列标注上的突出优势,结合优化的抽取规则实现中医实体关系联合抽取。该方法不仅克服了传统流水线方法的弊端,很大程度地缓解了实体重叠的问题。(3)提出了一种融合数据增强和注意力机制的实体关系联合抽取方法。该方法选用EDA方法对中医语料进行数据增强,采用自训练方式将原数据集和预测所得的伪标注数据共同学习,解决标签数据缺乏的问题,在中医语料实体关系联合抽取任务上具有较好的适应性。(4)在上述研究的基础上,设计并构建中医文本实体关系联合抽取系统。
其他文献
伴随着各方面改革的不断深入,中国经济正从高速发展向高质量发展,90、00后年轻人婚姻家庭观念出现了百年未有之大变。同时,制度规范也在不断变化,家事案件总量逐年递增。随着科技的不断进步,家事案件也呈现出多样性、复杂性的特点。家事纠纷的处理效果不仅直接影响个人家庭幸福指数,还关乎整个社会的和谐稳定。全国各地法院在审判处理家事案件、解决家庭纠纷过程中,一直都在不断探索提高审理效率的理论制度、方式方法,同
情感表达是指运用情感词、句子、篇章等手段表达出各种情感倾向的过程。在言语交际中,人们通常都会流露出自身的喜怒哀乐。初级汉语学习者水平有限,偏向于使用简单直接、多用于口语环境的词汇和句型表达情感。随着汉语学习者水平的提高,情感表达的需求愈发强烈,内容更加多样,而且要适应口语和书面语的不同场景,语言要更加得体、准确。各类情感中,负面情感是带有否定、贬低色彩的情感倾向,在实际言语交际活动中会以委婉、曲折
近年来,越来越多的音乐治疗师开始在精神科领域开展临床工作,但在研究方面,使用音乐治疗来缓解儿童和青少年抑郁和焦虑症状的有效干预证据相对较少。本研究旨在探讨音乐治疗歌曲写作方法对青少年抑郁症患者的干预效果。本实验被试人群为青少年(13-18岁)抑郁症患者,共36名,对照组有18人,仅接受药物治疗,实验组有18人,同时接受药物治疗和8次团体音乐治疗,一周两次,每次1.5小时。干预前后收集两组患者SDS
目的:探究大学生成人依恋、自尊和恋爱压力各自的现状特点和人口学影响因素,探究大学生成人依恋和自尊、成人依恋和恋爱压力、自尊和恋爱压力之间的关系,以及三者之间的关系。从而能够更好的帮助教育工作者了解大学生在恋爱过程中遇到压力事件时的心理状态,及时地向大学生提供有针对性的心理辅导,缓解恋爱压力甚至摆脱困扰,帮助大学生顺利的完成这一时期的发展任务,促进其人格的健全发展,进而维护当代大学生心理健康。方法:
随着全球化的进展,国与国之间的交流越加紧密。中国传统文化也越来越吸引外国人的目光,而中医学作为中国优秀的传统文化之一,更加成为了关注的焦点。毋庸置疑,中医药的对外传播自然离不开中医典籍翻译的发展。《金匮要略》作为中医卓越典籍,不仅为中医医学的研究和临床实践提供了理论指导,其英译研究也对世界认识中医药有着深远的影响。文化负载词是指民族特有,并且无法与特定译语对应的词语。它能够使民族文化信息通过语言表
在民族舞蹈教学中,课前热身、课中动作的辅助训练和课后放松这三个环节经常被人们所忽视,但这在舞蹈的动作教学中其实是非常重要的。对于学生而言,课前准备、课中提高和课后恢复这三个环节,如果有了很好的辅助训练方法,可以更加轻松和高效的上好一堂舞蹈课程;对于教师而言,有助于完成教学任务和课程目标,使教学过程更具有科学性和丰富性。本课题选用了普拉提小器械为民族舞蹈教学提供辅助训练,在训练与教学相结合的过程中,
目的:本次课题通过观察化肝煎加味联合PPI制剂治疗胃食管反流病肝胃郁热证的临床治疗效果,对化肝煎加味方各味药物进行理论分析,讨论以疏泄肝热、和胃降逆为法的化肝煎加味在胃食管反流病的治疗中的重要价值的体现,探索中医中药联合PPI制剂治疗前后对于胃食管反流病患者后期病情变化的影响。本文研究化肝煎加味治疗肝胃郁热型胃食管反流病,观察其临床表现,根据疗效评定标准得出积分进行比较,从而评分其疗效,为胃食管反
目的:本研究旨在通过建立中医药治疗原发性肺癌(Primary lung cancer,PLC)患者90天死亡风险预测的真实世界研究的模型,筛选PLC患者预后的风险因素,预测中医药参与治疗PLC患者90天的死亡风险,为PLC患者的预后及生存期提供参考,并以此为基础,科学地评估治疗目标,制定合理的治疗方案,减轻患方负担,以期便利本人日后相关临床工作。方法:搜集江西省中医院肿瘤科2019年07月01日至
H9N2亚型禽流感病毒(avian influenza virus,AIV)自1992年在我国广东省鸡群中发现以来,已蔓延至全国大多数地区,呈地方流行性,难以彻底根除。经过多年的遗传进化,H9N2亚型AIV的致病性和传播性不断增加,给家禽养殖业造成严重的经济损失。此外,H9N2亚型AIV可以突破种间屏障直接感染哺乳动物包括人;并提供内部基因给其他亚型AIV产生如H5NX、H7N9、H10N8等人兽
随着新媒体发展,非遗题材纪录片在叙事上呈现出和之前不同的叙事维度,同时在传播方面也出现新的发展路径。通过对叙事维度和传播路径的研究,有利于寻找共识,扩大宣传,助力发展,最终有利于非物质文化遗产的文化传承和有效传播。论文以新媒体时代非遗题材纪录片为主要研究对象,以CCTV央视网、爱奇艺、腾讯视频、优酷、哔哩哔哩五个视频平台的非遗题材纪录片为研究文本,主要分为五部分,第一部分为绪论,主要从研究背景、目