论文部分内容阅读
随着我国社会信息化工作的全面开展,企业、政府单位陆续开发了大量的信息管理系统,但这些信息系统是在不同时期、根据当时不同需求而单独设计、开发出来的,各自面对单独的业务而独立运行,存在数据和信息系统分散、信息资源利用程度较低、对管理决策能力支持度较低等缺陷。因此,对各异构系统进行数据整合实现数据共享、数据综合分析,从而提升管理的决策能力成为十分普遍的迫切要求。
本文以广东省高中阶段教育招生统一服务平台(以下简称为招生统一服务平台)的设计开发为项目背景。对原有六个招生服务系统进行全面的分析,分析各个系统之间存在的异构和孤立等问题,并对它们进行数据整合需求分析,提出数据整合方案--运用ETL,(数据抽取、转换和加载)和CDC(增量数据抽取)等技术整合原有六个异构系统数据库建立招生服务数据仓库,并在此基础上开发了招生统一服务平台。该平台的实施将为全省高中阶段教育招生服务和分析提供更加丰富和更深层次的数据和信息,为省招办、地市招办等管理部门提供全面的综合的数据分析和决策支持,有利于高中阶段各类学校选拔人才,促进高中阶段教育的发展。本平台的实施也可以为其它省、市的招生服务信息化工作提供一些技术上的思路和帮助。
首先分析了课题的研究背景和国内外研究现状,并指出本课题的主要研究内容和特色。接着对数据整合的相关技术进行介绍。主要介绍了ETL(数据抽取、转换和加载)技术,比较了各种增量数据抽取方式的优缺点,分析了数据仓库和联机分析处理(OLAP)的处理方式。然后从需求分析、功能结构、数据表结构方面对原有各个招生服务系统进行了分析,并指出了各个招生服务系统之间存在的问题。从中引出了本文的研究重点--招生信息化建设中数据整合的研究与应用。接下来在针对各个招生服务系统之间存在的问题,对招生服务系统数据整合进行需求分析和提出解决方案。然后对解决方案中的招生统一服务平台数据整合进行了详细的分析与设计。首先进行对系统的总体架构设计,然后分别设计了数据整合模块中的数据整合架构、数据整合处理流程等,并通过数据清洗与转换等技术来保证数据整合的数据质量,通过增量数据更新来保证数据的实时性。最后设计招生服务平台数据仓库数据仓库存储结构和分析主要主题逻辑模型,为前端应用开发做好了基础。
最后运用本文设计的数据整合架构实现了招生统一服务平台的数据整合应用。此平台实现招生服务各个异构系统数据库的数据整合,提供了全面的综合的数据分析、统计、查询和决策支持基础。