论文部分内容阅读
在大数据时代和数据密集型科研范式下科研档案管理需要新方法和新手段。针对目前科研档案管理过程中存在的科研知识关联度差、科研档案资源利用程度不高等问题,本研究通过构建基于知识图谱的科研档案管理模型,从知识层面将科研档案资源中的科研机构、科研项目、科研成果、人员等要素与项目任务书、合同、研究报告中抽取的知识单元进行关联和融合,丰富科研档案的语义关系,推进科研档案管理系统提档升级,对提高科研档案管理水平,支撑科研单位管理决策、科研档案智能管理、档案资源深度开发和利用具有重要的理论和实践意义。本论文采用了文献分析法、专家访谈法、系统分析法、案例分析法以及知识图谱构建方法与理论等,对科研档案管理模式、收集、加工以及存储等现状进行了分析,凝练科研档案管理深层次加工、多元化关联以及决策支撑等需求,为基于知识图谱开展科研档案管理研究提供了理论基础与支持。通过研究取得了以下结论,研究结果具有一定的创新性:(1)研究了用于科研档案管理的知识图谱构建过程。通过对知识图谱的构建要素(知识单元与语义关系)的综合分析,从实际应用角度出发总结了知识图谱的适用领域,为科研档案知识图谱的构建以及科研档案管理系统的设计奠定了基础。(2)构建了基于知识图谱的科研档案管理模型。通过数据解析、深层次揭示以及实体抽取过程实现科研档案细粒度实体识别。结合Nanopublication与CERIF模型,设计科研档案资源描述体系,构建了科研档案多维度关联模型。基于本体编辑工具Protégé,使用资源描述框架RDF和OWL语言,继承利用EAD、DCMI等现有较为通用的元数据构建科研档案知识图谱模型,将人员、机构、成果等实体与科研档案资源知识层面的研究任务、实施方案等实体语义串联在一起。通过深层次知识融合与推理进一步丰富和完善科研档案语义关联。(3)构建了基于知识图谱的科研档案管理系统原型。基于知识图谱的科研档案管理模型,构建了一个覆盖档案管理全生命周期的,包括数据解析层、智能识别层、语义关联层以及智能管理层的科研档案管理系统原型。以农业信息研究所科研档案为数据源,实现智能化采集与归档、自动抽取与关联以及语义增强等功能,提高了科研档案资源语义关联性,提升了科研档案管理效率。(4)基于知识图谱的科研档案管理系统应用效果分析。为验证基于知识图谱的科研档案管理系统的实用性,从知识识别粒度、知识多维关联度以及知识融合与利用程度等方面将基于知识谱图的科研档案管理系统与传统的档案系统进行了对比分析。应用效果表明基于知识图谱科研档案管理的具有可行性和良好的应用前景。