生物医学文献中的因果关系识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:qpzm007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因果图在确定因果关系中起着至关重要的作用,当前已应用于包括生物学和医学等许多领域。传统的因果图构造方法通常是数据驱动的,因此可能无法提供所需的图精度。考虑到大量出版物中含有大量的因果关系知识,从文献中提取因果关系以帮助建立因果图成为可能。为了提高因果关系的提取准确率,本文从两个方面提出了提取因果关系的算法。1)集成基于规则的方法和无监督的学习模型的因果关系提取算法:该方法包括数据预处理,句法模式匹配和因果关系确定三个模块。在数据预处理中,在提取和简化句子之前,将基于属性名称对摘要进行爬取。在句法模式匹配模块中,算法通过解析句子以获得词性标签,基于这些标签得到三元组,然后进行句法模式的匹配。在因果关系确定中,初始化四个动词种子集,并通过应用无监督机器学习模型为种子集和三元组中的动词构造单词向量。通过比较每个三元组中的动词与每个种子集中的动词之间的相似性,来克服因果关系的局限性,从而确定因果关系。与Alashri和Bui的算法相比,实验结果表明本章算法的F值分别提高了8.29%和5.37%。2)基于循环神经网络的因果关系提取算法:该方法提出了一种新的数据处理方式,能够提升循环神经网络在小语料库中的因果关系提取性能,方法包括数据处理和因果关系确定这两个模块。数据处理部分包括与上文一致的数据清洗工作,关键部分提取,添加词性标签和相似词汇替换这四部分组成。相比于采用传统的数据预处理的长短时记忆网络方法,实验结果表明本章算法的F值有所提升。本文提出的两种关系提取算法均能较为准确的提取出文本中潜藏的因果关系,可以用于帮助构造因果图。因果关系作为构造因果图的基础则可以使用基于数据驱动的方法来验证和补充。
其他文献
底板岩体的稳定性主要取决于底板岩性组合和所处复杂地质力学环境,当煤层底板存在承压含水层时,在采动矿压和水压力的联合作用下,极易造成底板岩体破坏失稳,承压水头沿着底板裂隙逐渐向上扩展导升,当承压水头突破有效隔水层时极易引发突水事故。本文通过理论分析、耦合材料模拟实验、数值模拟和现场实测等手段,对承压水上膏体充填开采防治底板突水机理进行了研究,主要研究成果如下:(1)基于弹性力学和塑性滑移线场理论,对
学位
在定焦摄像头的生产流程中,镜头模组需要调焦在光学焦点处才能流入下一生产环节。而镜头模组定焦的生产模式常为人工手动定焦,需要人眼观察图像是否清晰,调整镜头达到清晰后
沿空放顶成巷技术不仅可以解决采区工作面采掘接续紧张问题,同时可以提高煤炭回采率,增加矿井经济效益。本文以金达煤矿五采区12510工作面为工程研究对象,采用理论分析、数值模拟和工程实践相结合的方法,对薄煤层沿空放顶成巷技术进行研究,主要研究内容及相关成果如下:(1)提出沿空放顶成巷概念,系统的分析了该技术成巷原理、顶板破碎机理及垮落结构特征,总结了影响顶板放落效果的各种因素。(2)研究总结沿空放顶成
图像字幕生成就是根据输入图像生成一段内容描述语句,该任务涉及图像处理方法和自然语言处理方法。近年来随着互联网的发展和大规模数据的出现,深度神经网络凭借着强大的数据
化石燃料燃烧所导致的的温室效应已成为人类亟待解决的关键问题之一。由于CO2是主要的温室气体,作为碳捕捉与封存(Carbon Capture and Storage)技术之一的富氧燃烧(oxy-combusti
高功率输能窗的射频击穿是对微波源乃至整个真空系统的稳定工作影响最大的因素,输能窗的射频击穿往往由窗片表面二次电子倍增效应激发。因此,开展高功率输能窗二次电子倍增效
在当今艺术体操处于白热化的竞争格局下,找寻出阻碍我国集体项目发展的原因,是目前我国艺术体操集体项目急需解决的迫切问题。集体项目的精华在于用5名运动员之间的默契配合
随着汽车行业的蓬勃发展,人们对汽车制动系统的安全性要求也越来越高。汽车制动器作为汽车制动系统中最重要的一环,其制动性能的好坏直接影响到人们的生命财产安全。磁流变制动器是一种20世纪90年代兴起的智能材料制动器,其具有响应速度快、制动噪声小、可调节性强等优点,是汽车制动器的研究热点和发展方向之一。然而,由于磁流变效应机理较为复杂,磁流变制动器性能影响因素较多,使得目前国内外基于磁流变效应的制动器主要
全球气温变暖等一系列资源环境问题的存在使得节能环保成为了城市发展建设中的一大主题。伴随科技的飞速发展,城市生活中的冷热电需求也在不断增长。传统的能源供给系统已经无法满足资源环境与的需求。因此,如何在能源供给中选择更加高效、经济的供能配置方案是研究的重点。论文选择城市区域作为研究对象,使用GLPK(GUN Linear Programming Kit)方法构建模型来研究区域供能配置问题,并在绿色低碳