论文部分内容阅读
信息技术作为21世界的标识,随着它的发展和普及给人类的生活和工作带来了前所未有的改变。网络技术的发展,导致数据分散存储在不同的设备中,并且每刻都在不停的流动。现有的软件体系不能较好的适应大数据时代,由于其自身的局限性,难以解决信息共享、系统扩展、数据高效管理和数据挖掘等一系列问题。为了解决大数据时代面临的问题,DOA体系架构应运而生。DOA通过数据注册中心(DRC)、数据权限中心(DAC)和数据异常中心(DEC)统一定义管理和提供数据服务;通过数据应用单元(DAUs)对各种应用进行管理和服务,建立一种数据大平台与碎片化应用的数据生态系统。数据注册中心作为一个逻辑资源池,存储着大量已注册的元数据,随着数据注册量的增加,元数据的总量也越来越多。元数据分类对元数据的存储和检索有着重大的意义,元数据分类具有节省存储空间和提高检索效率等优点,同时对企业具有一定的商业价值,可以预测行业走向、分析用户行为和为企业提供决策依据。由于元数据的广泛使用,使得元数据的数量越来越多、种类越来越复杂和划分越来越难。因此探究一种科学的分类方法,是目前DOA下急需解决的问题。本文主要在DOA和元数据的基础上,结合元数据的特点,从多角度对元数据进行分类,详细设计了元数据分类过程。对比分析目前常用的元数据标准,并结合DOA特点,制定了DOA下具有通用性的元数据规范;根据元数据的字段提出了根据主题、时间、地域和检索频率四个规则对元数据进行分类;由于元数据分类之后会对其进行存储和检索,因此,在元数据分类之后,本文简单阐述元数据的存储和检索问题。本文主要工作如下:(1)元数据理论研究。数据注册中心是DOA核心,元数据是数据注册中心的核心。(2)制定元数据规范。通过对比分析目前常用的元数据标准并结合数据注册中心的特点,制定了DOA下具有通用性的元数据规范。(3)分类规则的提取。通过研究现有的元数据分类规则,并结合本文制定的元数据规范,提出了根据元数据检索频率、主题、地域、时间进行分类的规则。本文取得的研究成果和创新点:(1)制定了DOA下具有通用性的元数据规范。元数据规范是元数据分类的前提。本文通过研究现有的元数据标准并结合数据注册中心对数据管理的需求,自定义了DOA下具有通用性的元数据规范。(2)提出了一种基于元数据字段的分类方法。根据元数据和DOA的特点,提出了一种按照元数据字段分类的方法,即按照元数据的主题、时间、地域、检索频率进行分类。