基于表示学习的上下位关系识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同领域的知识库出于不同的目的被构建,然而,由于需求不同,知识库的构建方式不同,知识库中的知识呈现出了组织松散,多源异构的特点。因此,构建能够结构化地描述领域概念的工具——本体对于知识的复用和有效信息的提取意义重大。由于领域本体的构建是一个比较复杂的过程,需要大量人力参与,因此本文的目的是利用自动化的方法辅助解决本体构建环节中的上下位关系识别问题,减少人力损耗。由于信息增长,对于原有的知识库,会新增未知类别的实体;对于新建知识库,知识库中实体的类别本身未知。而如何划分这些未知类别的实体就是实体的上下位关系识别问题。本文主要解决的是医学领域的上下位关系识别问题。因此本文从医学知识库SemMedDB中提取出所需的知识,并利用SemMedDB对应的医学领域本体UMLS验证识别出的上下位关系。解决上下位关系识别问题的关键就是如何有效学习到实体的特征。通过观察知识库中的知识可以发现,知识被组织为多关系图的形式,因此本文分别利用异构信息网络嵌入算法,知识图谱补全模型,直接利用关系作为实体特征的方法得到了实体的特征向量,并利用得到的特征向量作为实体的特征对实体进行分类和聚类,为实体类别的划分提出指导性意见,解决上下位关系识别问题。通过可视化知识图谱补全模型学习到的实体特征向量,发现在向量空间中,同类实体的特征向量距离较近,不同类别的实体之间有较为明显的界限;同时,利用知识图谱补全模型学习到的特征向量和关系作为特征的向量拼接并对实体进行分类,分类的准确率在有122个类别的情况下可以达到71.2%。实验证明,可以利用知识图谱补全模型学习到的特征向量和关系直接作为实体特征得到的特征向量作为分类和聚类的特征有效解决上下位关系识别问题。
其他文献
作为源头的供应物流在整个汽车物流中起着举足轻重的作用,本文通过分析我国汽车制造企业供应物流的现状和存在的问题,提出将第三方物流引入汽车制造企业供应物流是优化我国汽
自我概念清晰性是结构化的自我概念,是指个体对自我评价和自我认识的自信和明确程度,它对于学生的学习和生活等都有重要影响。本研究以中学生为研究对象,探讨中学生群体自我概念清晰性的特征,及其对于学习投入的影响,从而为提高中学生学习投入的水平提供理论依据。参照以往研究发现,个体的领悟社会支持能力可以对个体的学习生活等产生一定的影响,因此本研究还探究了中学生领悟社会支持在自我概念清晰性和学习投入之间的作用机
目的探讨达格列净联合胰岛素泵强化治疗新发糖尿病的效果及对胰岛β细胞功能的影响。方法选取2017年1月-2018年1月我院收治的120例新发糖尿病患者为研究对象,采用随机数字表
近年来,伴随着我国基础教育改革逐步深化,素质教育越来越受到重视。随着《关于推进中小学生研学旅行的意见》《中小学综合实践活动课程指导纲要》等政策文件相继出台,研学旅
学界和业界通常认为股票市场指数能够反映股市状况,市场指数收益率可以代表市场的平均收益水平。基金主动性管理是在时空维度上对基金进行相对于指数的改变,以战胜市场,获取
白云鄂博超大型铌-铁-稀土矿床,同时含有萤石、硫、磷、钾、钪、钍等多种具很大经济价值的元素和矿物,是目前世界上发现新矿物种类最多的矿区之一。其中,萤石是白云鄂博矿床中分布最广且生成时间延续最长的一种脉石矿物,具有重要的利用或者潜在利用价值。为了合理开采和利用矿床中的萤石,实现资源降本增效,查明含萤石矿石在矿床中的分布及萤石特征是十分必要的。为此,本文主要基于详细的岩相学、矿相学、工艺矿物学和地球化