论文部分内容阅读
科学数据是重要的信息资源,是支撑科学研究的关键性资料,同学术论文一样,其具有重要的科研价值,科学数据可以对以论文形式发表的成果进行补充说明,能够帮助用户更加清楚科研的整个过程,可用于研究再现及证伪,可以以搜集到的科学数据为研究起点,继续深入研究。科学数据的共享可以减少重复研究,节省数据搜集及保存、维护成本,避免资源建设的浪费,也使得政府财政投入科研活动的价值得到进一步提升。对科学数据进行组织是科学数据共享、检索和利用的前提。元数据在信息描述、组织,信息的检索、发现方面具有重要的作用,元数据可以用于描述科学数据的内容及形式等特征,是组织科学数据资源的重要工具。由于科学数据资源机构、资源所属学科、资源类型、资源使用目的等方面的不同,用于描述科学数据资源的元数据也多种多样。元数据的多样性妨碍了用户一站式获取科学数据资源,给用户搜索、获取及利用资源带来不便,因此需要通过元数据之间的互操作来解决问题。面对多样的描述科学数据资源的元数据,通过哪些合适的方法实现元数据之间的互操作,是本文主要研究的问题,笔者选取地球科学相关领域的科学数据元数据标准,研究元数据之间的互操作方法,为国内其他领域科学数据元数据互操作的实现提供借鉴。本文共包括8个部分,具体内容如下:第0章绪论。介绍相关研究背景及意义,梳理国内外研究现状并进行评述,明确研究目标、内容及方法,以及本文存在的研究难点及本文的创新点。第1章相关概念及理论基础。阐述了科学数据、元数据与科学数据元数据、地理信息元数据、元数据互操作、以及地球科学这些相关概念;探讨了知识组织理论、用户信息行为理论、系统理论、信息资源增值利用、信息资源共享理论对科学数据元数据互操作的理论支撑。第2章科学数据元数据互操作的必要性及可行性分析。通过对科学数据元数据互操作的必要性及可行性进行分析,必要性包括元数据标准的多样性使得元数据之间互换困难、元数据标准之间存在的差异是元数据互操作存在的主要问题、元数据互操作是数字资源整合的基础;可行性在于元数据功能的不断完善是选用元数据实现互操作的原因,以及元数据互操作技术的发展与实践成果提供的支撑。第3章元数据互操作方法及其适用性分析。参考已有研究成果,建立元数据互操作方法的框架及层次,将元数据互操作方法的层次划分为语义、语法与结构、协议三个层面,并对每个层面及其适用性进行分析,最后探讨了元数据互操作在科学数据中的应用。第4章科学数据元数据互操作方法的选取及实现。对地球科学科学数据相关领域的元数据标准进行选取,并选择合适的互操作方法,实现元数据之间的互操作。本章先探讨科学数据元数据标准的选取,并明确ISO 19115-1:2014、澳大利亚新西兰土地信息局元数据、地理信息元数据、NREDIS信息共享元数据内容标准草案四种地球科学领域核心元数据元素及其语义,分析核心元数据元素的特点,以及明确全集元数据DIF、CSDGM、地理信息元数据的元素及其语义;接下来探讨互操作方法的选取,选择两两映射、中间格式映射、基于RDF的方法实现元数据之间的映射,基于概念框架的方法,在语义层面实现元数据之间的互操作,并提出基于本体实现元数据互操作方法的设想。第5章元数据互操作方法的应用:地球科学科学数据元数据标准的选取与比较。笔者搜集并选取包含国家环境信息中心海洋地质数据、康奈尔大学地理空间信息机构库、全球变化主目录、地热数据存储库、跨学科地球数据联盟、世界大气遥感数据中心、国家地震科学数据共享中心、生物和化学海洋学数据管理办公室、国家环境信息中心海洋和大气管理在内的9个地球科学相关领域的科学数据平台使用的元数据标准,并从元数据元素的数量、元数据的层级、元数据的内容以及元数据元素语义详细程度四个方面对其进行比较。第6章元数据互操作方法的应用:实现地球科学科学数据元数据互操作的本体构建。选取第五章中搜集到的9种科学数据元数据为研究对象,对其元数据元素建立本体。阐述本体的内涵、本体建构过程、以及本体的应用。第7章结语。通过本文的研究,得出以下结论:科学数据元数据互操作具有必要性及可行性;元数据互操作方法适用于科学数据领域;使用本体能更好地实现科学数据元数据之间的语义互操作;基于本体实现地球科学领域科学数据元数据互操作为其他领域提供借鉴。并说明了本研究中存在的局限,以及对未来的研究进行展望。