科研评估体系中数据预处理系统设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:funkfood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识经济条件下,知识更新速度加快,科学技术发展迅猛,科研评估体系出现了新的发展动向。在科研评估体系中,数据的处理在其中占有重要的作用,随着大型科技文献、论文、专利数据库系统等在科学研究中的广泛应用,全球范围内的科技数据信息量急剧增大。面对庞大的科技信息数据库,需要快捷地从中提取出有用和有效的知识,因此巨大的科技信息数据有待分析处理。 本项研究基于中国科学院ARP项目评估评价系统,结合实际的应用实施,分析了现行科研评估系统中数据情况,介绍了如何在中科院评估评价系统中构建数据预处理系统。本文首次尝试将数据预处理技术应用到科研评估系统的数据预处理过程中,开发一个针对海量评估数据的数据预处理系统。 本文首先介绍了中国科研评估体系的现状及其面临的问题,并对现行的数据预处理和元数据的研究现状进行了分析,在此基础上提出了本研究所设计的系统——数据预处理系统。其共分为三个部分:元数据库、规则定义模块和数据处理模块。系统的整个工作流程如下:首先将通过数据库扫描获取源数据库、目标数据库的结构内容信息,并将其存入元数据库中;然后用户根据这些结构内容信息,定义数据抽取、转换等各种规则,以期获取自己所需要的数据,并将其存入元数据库中;最后数据处理模块从元数据库中获取各种已定义好的规则,调用其功能模块对其进行处理,从而获取用户所需要的数据。在整个系统设计实现中涉及到一系列技术和方法,像数据预处理技术、元数据模型技术和XML技术等等,本文对此也作了一定的介绍。 本文解决的关键问题有以下几方面: 第一、针对数据预处理系统设计中关键问题之一—元数据库的设计,本文采用三层模型结构:将元数据库逻辑上分为代理层、服务层和对象层。与此层次结构相对应的,元数据库的系统结构设计仍然采用技术比较成熟的客户机/服务器模式(Client/Server mode),这样设计提高系统独立性,同时为决策和技术人员提供同样的视角,但提供不同的操作功能。 第二、针对以前评估系统存在的问题——抽取的数据不尽如人意,系统设计了规则定义模块,方便用户按照自己的需求定义各种数据处理规则,使系统具有很强的灵活性;同时设计了统一的接口,友好的人机界面,简单易操作。
其他文献
随着网络和通信技术的发展,图像信息安全受到越来越多的重视,大量的图像加密和数字水印方案相继被提出。由于光学信息处理速度快、并行性高的特点,使得在图像加密方法中运用
本文针对并行数据库的查询优化处理领域,提出了一种基于Multi-Agent技术的语义查询模型(SQMAS),并以此模型为基础建立了一种基于Agent的并行数据库语义查询方法,同时为了保证系
数据挖掘技术是解决数据丰富而知识贫乏的有效途径,当属信息科学领域的前沿研究课题之一,有关的研究和应用极大提高了决策支持的能力,它已被公认为是数据库研究中一个极富应用前
随着Internet网络的发展,涌现了大量的新应用,如软件分发、视频会议、股市行情等都需要一对多或者多对多的可靠的组播通信,其潜在的接收者可能成千上万。与单播和广播技术相比,组
在日常生活中,网络技术的应用已渗透到各方面,信息泄漏事件频繁发生,给人们的人身和财产安全带来了巨大的危害。因此对信息的保护已成为各行各业亟待解决的问题。而安全风险评估
随着网络技术的不断发展,分布式系统得到了广泛的研究与应用。分布式系统采用并行计算模型。PRAM模型作为并行模型的一种,本文主要就PRAM模型应用于分布式同步机制的问题进行研
网格是人们为了满足不断攀升的计算能力需求而提出的一个全球性解决方案,与传统网络环境不同,网格中计算资源,用户都是动态的分布,网格环境中虚拟信任关系需要动态的创建和消
互连网络的性质对整个网络的性能起着决定性作用。然而,由于互连网络设计是一个多目标最优化问题,所以很难找到一种互连网络适合所有并行系统。因此已经有许多的互连网络被提出
随着计算机视觉、模式识别和网络传输等相关计算机技术的不断发展,交通视频监控正在向着智能化、高清化、数字化和网络化方向发展,监控数据的存储也在由分散的前端存储转向控制
近年来,随着互联网的飞速发展,Web服务作为一种新型的互联网软件为企业和个人用户提供了巨大的方便和灵活性。Web服务以平台无关性,高内聚,低耦合,调用简单方便,费用低的特点吸引了